JPS5995641A - 文字変換装置 - Google Patents

文字変換装置

Info

Publication number
JPS5995641A
JPS5995641A JP57206641A JP20664182A JPS5995641A JP S5995641 A JPS5995641 A JP S5995641A JP 57206641 A JP57206641 A JP 57206641A JP 20664182 A JP20664182 A JP 20664182A JP S5995641 A JPS5995641 A JP S5995641A
Authority
JP
Japan
Prior art keywords
character string
string
character
priority order
priority information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57206641A
Other languages
English (en)
Inventor
Makoto Tatebayashi
誠 館林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP57206641A priority Critical patent/JPS5995641A/ja
Publication of JPS5995641A publication Critical patent/JPS5995641A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/018Input/output arrangements for oriental characters

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は仮名や英語のような第1の文字列を、これに対
応する漢字や日本語のような第2の文字列に変換して出
力する文字変換装置に関するものであり、特に第1の文
字列に対応して複数個の第2の文字列が存在するときに
、その中から所望の文字列を容易かつ高速に取り出すこ
とのできる文字変換装置に関するものである。
従来例の構成とその問題点 入力された第1の文字列を、第1の文字列から変換辞書
を用いて第2の文字列に変換して出力する文字変換装置
は、従来より広く知られている。
特に第1の文字列に対応して複数個の第2の文字列が存
在する場合、当該第2の文字列のおのおのに対してその
文字列が過去に何度選択されたかを示す頻度情報を記憶
させ、この頻度の値が太きい順に優先的に出力するもの
が知られている。ところがこの装置ではある第2の文字
列が選択されるたびに当該文字列の頻度が1増加し、さ
らに通常前記頻度情報(d有限のビット数の領域(例え
ば4ビット)に格納されているだめ、昌核文字列が繰り
返して選択されたときには頻度が許容最大値に達し、さ
らにもう一度選択されたときには頻度がOとなってし丑
う。このため、最も優先順位の高いはずの第2の文字列
の優先順位が最下位になってし′まうという不都合が生
じるものであった。
」−記の欠点を改善するために為された工夫として次の
ようなものがある。すなわち、上述のように、ある第2
の文字列の頻度がある規定の値に達した場合、もしくは
ある規定の値を越えた場合に、当該第2の文字列および
その他の第2の文字列の頻度を、それらの文字列の頻度
の大きさの順を保ちながら、例えば−斉に%にするなど
して圧縮するのである。こうすれば有限の大きさの頻度
情報領域を永久的に使用できるものであった。しかしな
がら、この実現にあたっては、頻度を所定の規定値と比
較し、さらに頻度を一斉更新する処理が必要となるもの
であった。
発明の目的 本発明は従来の文字変換装置が有していた上記の問題点
を解決するためになされたもので、その目的は有限の大
きさの優先順情報を用いながら、前記優先順情報の一斉
更新等の処理の必要がなく、永久的に合理的な優先順情
報を得ることのできる文字変換装置を提供することにあ
る。
発明の構成 本発明は上記の目的を達成するため、第1の文字列によ
って複数の第2の文字列が対応する場合、8第2の文字
列に対して有限の大きさの2進数値で示される優先順情
報を割り当て、ある第2の文字列を選択した場合には当
該第2の文字列の優先順情報を所定量だけ増加させ、そ
の他の第2の文字列の優先順情報は、全体の数値の総和
が一定となるように所定量だけ減少させることにより、
有限の大きさの優先順情報領域に永久に合理的な優先順
情報を記憶させ得るものである。
実施例の説明 以下本発明の一実施例について1図面を参照しながら説
明する。なお本実施例では、第1の文字が仮名であり、
第2の文字が漢字仮名混じ9文字であるものとする。す
なわち、本実施例における文字変換装置は、仮名列を入
力すれば、その仮名列を仮名列を読みとする日本語の漢
字仮名列に変換する、いわゆる仮名漢字変換装置に相当
する。
第1図は本発明の一実施例における文字変換装置のブロ
ック図である。
同図において、1は第1の文字列入力部で、第1の文字
列を入力し、これを一時記憶する。2は第1の文字列検
索部で、第1の文字列入力部1より入力された仮名列を
、後述する文字列記憶装置の中で検索する。そして該当
する仮名列が複数個ある場合には、後述する優先順位の
最も高いものを出力する。3は文字列記憶装置で、第1
の文字から第2の文字−の変換のだめの情報を記憶して
いる。すなわち、第2図に示すように、第1の文字列(
a)と、第2の文字列(b)と、第2の文字列に固有な
情報(C)と、後述する優先順情報記憶部へのポインタ
(d)とから成るレコードから構成されるものである。
第1の文字を指定した時に該当するレコードが検索され
やすいように、全レコードは第1の文字によって順序付
けられて記憶されている。
また、第2図に示した例においては、第2の文字列に固
有な情報としては当該単語の品詞を割り当てている。4
は優先順情報記憶部で、ある第1の文字列に対して複数
の第2の文字列が存在するとき、その第2の文字列の間
の優先順位を示す情報記憶するものである。この優先順
位情報は有限のピッド数(本実施例では4ビツトとする
)の2進数の数値であり、この数値の大きい方が優先順
位が高いと定められる。この記憶内容は書き換え可能な
ものであって、半導体メモリなどで実現される。さらに
本実施例においては、上記複数の第2の文字列の数をN
としたとき、このN個の第2の文字列のおのおのの優先
順情報の和がsxNとなるようにそれぞれの優先順情報
を初期設定しておくものとする。
5は第2の文字列出力部で、第1の文字列検索部2か検
索し/4第2の文字列、又は後述する次候補検索部か検
索した第2の文字列を出力する。これは例えはCRTテ
ィスゲレイなどが用いられる。
6は次候補検索部で、後述する次候補要求部からの起動
信号により起動され、現在第2の文字列出力部5に出力
されている漢字仮名混じシ列と同じ読み仮名を有する、
他の漢字仮名混じり列のうち、優先順情報記憶部4に記
憶されている優先順情報(2進数値)が現在出力中のも
のの次に大きいものを検索し、これを第2の文字列出力
部6に出力する。7は優先順情報更新部で、後述の第2
の文字列選択部からの起動信号により起動され、現在第
2の文字列出力部5に出力されている漢字仮名混じり表
記と、この表記と同じ読みを有する他の漢字仮名混じシ
表記(いわゆる同音語)との優先順情報を次のように更
新する。すなわち、上記の同音語数(現在出力中のもの
も含めて)をNとしたとき、現在出力中の第2の文字列
の優先順情報をN−1だけ増加させ、それ以外のN−1
個の第2の文字列の優先順情報をそれぞれまたけ減少さ
せる。このようにすれば、優先順情報の更新の際に更新
される同音語の群の優先順情報の総和が常に一定である
ことが明らかである。寸だ、現在出力中の第2の文字列
の優先順情報にN−1を加えた値が規定値(本実施例の
場合にば2!56とする)を越す場合には、上述の優先
順情報の更新は行なわないものとする。8は次候補要求
部で、第2の文字列出力部5に出力中の第2の文字列が
所望のものではない場合に起動される。これは例えば一
つのキイーで実現され、このキイーの押下により、次候
補検索部6に対して起動信号が送出される。
9は第2の文字列選択部で、第2の文字列出力部6に出
力中の第2の文字列が所望のものである場合に起動され
る。これは例えば一つのキイーで実現され、このキイー
の押下により、優先順情報更新部7に対して起動信号が
送出される。
以上のように構成された本実施例の文字変換装置につい
て、以下その動作を第3図のフローチャートに従がって
説明する。
(1)第1の文字列入力部1より第1の文字列を入力す
る。入力された第1の文字列は内部バッファに一時記憶
される。
(2)第1の文字列検索部2は第1の文字列入力部1に
一時記憶されている第1の文字列を、文字列記憶装置3
の中で検索する。
(3)検索が成功したとき、すなわち入力された第1の
文字列と全く同一の文字列が文字列記憶装置に存在する
とき(4)に進む。検索が失敗したときは(1)に戻る
(4)第1の文字列検索部2は入力された第1の文字列
と同一の第1の文字列を含むレコードの個数Nを求める
。そして、各レコードHの優先順情報記憶部4へのポイ
ンタを介して、優先順情報U(R)を読み取る。そして
、N個のレコードのうち最大の優先順情報U(R)を持
つレコードRを決定する。
(6)第2の文字列出力部6は前述のように決定された
レコードRの第2の文字列を出力する。
(6)  オペレータは第2の文字列出方部6に出力さ
れだ第2の文字列を見て、これが所望のものでない場合
には次候補要求部8を作動させる。
そして(7)の処理に進む。オペレータがこれ以外の動
作をしだ時は(8)に進む。
(7)次候補検索部6は、上述のN個のレコードのうち
現在第2の文字列出力部2に出力されているレコードの
次に大きい優先順情報U但)を持つレコードRを決定す
る。もしも現在出力中のレコードの優先順情報が上述の
N個のレコード中で最少であるならば、前記N個のレコ
ード中で最大の優先順情報U(R)を持つレコードRを
決定する。この後(5)に進む。
(8)オペレータは第2の文字列出力部5に出方された
第2の文字列を見て、これが所望のものである場合には
第2の文字列選択部9を作動させる。そして(9)の処
理に進む。オペレータがこれ以外の動作をした場合は(
@に進む。
(9)優先順情報更新部7は現在第2の文字列出力部5
に出力されているレコードHの優先順情報U(8)を優
先順情報記憶部4より取り出し、次式の第(1)式か成
立するか否かを判断する。
U (R) + N−1≦M  ・・・・・・・・・・
・・・(1)ここでNは前出の同音語レコードの数であ
り、Mは予め定められている優先順情報の許容最大値で
ある。第(i)式が成立するとき00へ進み、成立しな
いときは0ηへ進む。
α0 第(1)式が成立するときは、優先順情報更新部
7ば、現在第2の文字列出力部5に出力されているレコ
ードHの優先順情報U(R)を取り出し、これにN−1
を加えて、再び優先順情報記憶部4に格納する。さらに
、上記レコードR以外のN−1個の同音語レコードのそ
れぞれについて、優先順情報を優先順情報記憶部4から
取り出し、これから1を減じて、再び優先順情報記憶部
4に格納する。
θつ 本装置は入力された第1の文字列を第2の文字列
へ変換する処理を終了する。
以上、第3図のフローチャートを用いて本発明の一実施
例の動作を説明した。以下では本発明の一実施例につい
て、さらに具体的々動作例を説明する。
今、オペレータは「帰還」という漢字仮名混じり列を出
力させたいものとする。
(a)1ずオペレータは第1の文字列入力部1より、「
きかん−」という仮名列を入力する。(第3図(1)) (b)  第1の文字列検索部2は上記仮名列「きかん
」を文字列記憶装置3において検索する。すなわち、第
2図体)に示す文字列記憶装置3に記憶されているレコ
ードの第1の文字列と順次比較し、「きかん」という文
字列を検索する。
(第3図(2)) (C)文字列記憶装置3の内容が第2図に示すものであ
るとき、レコード番号1000,1001゜1002.
1003のレコードが該当レコードとして検索される。
(第3図(3)) (d)  第1の文字列検索部2は「きかん」という第
1の文字列を有するレコードの数Nは4であることを知
る。さらに、上述の各レコードの優先順情報記憶部4へ
のポインタがそれぞれ2000.2001.2002.
’2003  であることを知る。今、優先順情報記憶
部4の内容が第4図(a)に示すようにそれぞれ4,1
0゜13.5であるとする。このとき、第1の文字列検
索部2は、上記の4個のレコードのうちレコード番号が
1o02のレコードがこの4個のうちで最大の優先順情
報13を持つものであることを判定する。(第3図(4
))(e)第2の文字列出力部5はレコード番号1o○
2のレコードの第2の文字列「器官」を出力する・(第
3図(5)) (f)  オペレータは第2の文字列出力部5に出力さ
れた第2の文字列「器官」が所望するものではないので
、次候補要求部8を作動させる。
(第3図(6)) (q)  このとき次候補検索部6は、上述の4個のレ
コードのうち、レコード番号1o02の優先順情報の次
に大きい優先順情報を持つレコードを検索する。そして
、優先順情報記憶部内ポインタ2001で示される優先
順情報10をもつレコード番号1o01のレコードが該
当のものとして検索される。(第3図(7))(h) 
 オペレータは第2の文字列出力部6に出力された第2
の文字列「帰還」が所望するものであるので、第2の文
字選択部9を作動させる。
(第3図(8)) (i)  このとき、第2の文字選択部9は優先順情報
更新部7に対して起動信号を送出する。これを受けだ優
先順情報更新部9は、現在第2の文字列出力部5に出力
されているレコード番号1001のレコードの優先順情
報U(R)−1゜と、前出の同音語レコード数N=4と
、予め定められている優先順情報の許容値M−15が、 U(6)十N−1≦M の関係を満たしていることを判断する。(第3図(9)
) (i)  優先順情報更新部7は、レコード番号100
1のレコードの優先順情報を10から13へ更新する。
また、レコード番号1000,1002.1003のレ
コードの優先順情報をそれぞれ1減じて、3.12.4
として、これらを再び優先順情報記憶部4に格納する。
これを第4図(b)に示す。(第3図α0) (k)  本装置は文字変換処理を終了する。
この後、上述の第2の文字列「帰還」が再び選択された
ものとする。このとき、U(R)=13゜N=a 、M
=16であるため、U(R)+N−1≦Mの関係が成立
しない。この場合には上述の(i)の優先順情報更新処
理を行なわず、文字変換処理は終了する。
以上のように本実施例によれば、選択されたレコードの
優先順情報の数値と同音語レコード個数と優先順情報の
許容値の相対関係を調べ、選択されたレコードの優先順
情報が許容値を越さない範囲内で同音語レコード個数か
ら1を引いた数だけ増加させ、その他の同音語レコード
の優先順情報を1だけ減少させる優先順情報更新部を設
けたことにより、「きかん」という第1の文字を何度入
力しても、「帰還」という第2の文字が第1優先順位で
得ることができるのみならず、その他の1器官」「機関
」「貴官」というレコードの優先順情報は過去に選択さ
れた履歴を反映する合理的な値に保つことができる。
なお、本実施例においては、N個の同音語レコードのう
ち決定したレコードに対しては優先順情報をIj−1造
加させ、その他のレコードに対しては一様に1減少させ
たが、この配分に限定されるものではなく、同音語レコ
ード全体の優先順情報の総和を一定とする他の増加分、
減少分を割り当ててもよい。また、本実施例においては
、単独の日本語の単語の仮名漢字変換を例にとって説明
したが、日本語文章の読みを仮名で入力し、その仮名列
を読みとする日本語文章に変換する文章単位での仮名漢
字変換の場合にも本発明が同様に適用できることは言う
までもない。また、文字列記憶装置におけるレコードの
記憶状態は第1の文字列によって順序付けられているも
のとして説明したが、検索処理を高速にするだめの公知
の技術を適用してもよい。まだ、次候補検索処理の説明
において現在出力中のレコードの優先順情報が同音語中
最少であるときには、同音語中最大の優先順情報を有す
るレコードを次候補として出力するものとしたが、これ
に限定されるものではなく、例えば、これ以上同音語が
存在しない旨の出力を行なうものであってもよい。
さらに本実施例においては第1の文字列検索部は第1の
文字列入力部1より入力された仮名列を文字列記憶装置
中で検索した後、最も優先順情報の大きい第2の文字列
を第2の文字列出力部に出力するものとしたが、本発明
はこの構成に限るものではない。すなわち、第1の文字
列検索部は該当する複数の第2の文字列を一度に第2の
文字列出力部に出力するものとして構成しても良い。ま
た本実施例においては優先順情報は文字列記憶装置から
ポインタで示されるものとして説明したが、この情報を
文字列記憶装置内に記憶する構成とすることも可能であ
る。
発明の効果 本発明の文字変換装置は以上のように、第1の文字列に
対応する複数の第2の文字列のそれぞれに有限の大きさ
の優先順情報を付与して記憶させ、前記複数の第2の文
字列のうちのいずれかを選択したときにその第2の文字
列の優先順情報と優先順情報の予め定められた許容値を
調べ、選択された前記第2の文字列の優先順情報の更新
後の値が前記許容値を越さず、かつ前記複数の第2の文
字列の優先順情報の更新後の総和が更新前と等しいとい
う条件の下で選択された第2の文字列の優先順情報を増
加させ、その他の第2の文字列の優先順情報を減少させ
るような優先順情報更新部を設けたことにより、有限の
大きさの優先順情報領域を用いながら、何度優先順情報
の更新を行なっても合理的な優先順情報を保つことがで
き、この結果、所望の第2の文字列を高速かつ容易に得
ることができるので、その効果は大きい。
【図面の簡単な説明】
第1図は本発明の一実施例における文字変換装置のブロ
ック図、第2図はその文字列記憶装置の−記憶状態を示
す図、第3図は上記文字変換装置の動作を示すフローチ
ャート、第4図はその優先順情報記憶部の一記憶状態を
示す図である01・・・・・・第1の文字列入力部、2
・・・・・第1の文字列検索部、3・・・・・文字列記
憶装置、4・・・・・・優先順情報記憶部、5・・・・
・・第2の文字列出力部、7・・・・・・優先順情報更
新部、9・・・・・・第2の文字列選択部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 第2図 第3図 第4図 −2

Claims (1)

    【特許請求の範囲】
  1. 少なくとも第1の文字列とこれに対応する第2文字列と
    この第2の文字列に付随する優先順情報との組を多数記
    憶している文字列記憶手段と、第1文字列を指定する第
    1の文字列指定手段と、前記第1の文字列指定手段で指
    定された第1の文字列を前記文字列記憶手段中で検索し
    、これに対応するN個の第2の文字列を読み出す読み出
    し手段と、前記複数の第2の文字列のうちの一つを選択
    する選択手段と、前記選択手段により選択を行なったと
    きに選択された第2の文字列の優先順情報と優先順情報
    の予め定められた許容値とを調べ、選択された第2の文
    字列の優先順情報の更新後の値が前記許容値を越さず、
    かつ前記N個の第2の文字列の優先順情報の総和が一定
    であるという条件の下で、前記選択された第2の文字列
    の優先順情報を正数の値だけ増加させた値に更新し、そ
    の他の14−1個の第2の文字列の優先順情報を正数の
    値たけ減少させた値に更新する優先順情報更新手段とを
    有する文字変換装置。
JP57206641A 1982-11-24 1982-11-24 文字変換装置 Pending JPS5995641A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57206641A JPS5995641A (ja) 1982-11-24 1982-11-24 文字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57206641A JPS5995641A (ja) 1982-11-24 1982-11-24 文字変換装置

Publications (1)

Publication Number Publication Date
JPS5995641A true JPS5995641A (ja) 1984-06-01

Family

ID=16526714

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57206641A Pending JPS5995641A (ja) 1982-11-24 1982-11-24 文字変換装置

Country Status (1)

Country Link
JP (1) JPS5995641A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023005805A (ja) * 2021-06-29 2023-01-18 クェスタ株式会社 情報提供装置、情報提供方法及びプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023005805A (ja) * 2021-06-29 2023-01-18 クェスタ株式会社 情報提供装置、情報提供方法及びプログラム

Similar Documents

Publication Publication Date Title
JP3234104B2 (ja) 圧縮データをサーチする方法及びシステム
US6233580B1 (en) Word/number and number/word mapping
US5383121A (en) Method of providing computer generated dictionary and for retrieving natural language phrases therefrom
EP0775963B1 (en) Indexing a database by finite-state transducer
US5560037A (en) Compact hyphenation point data
US5553283A (en) Stored mapping data with information for skipping branches while keeping count of suffix endings
JP3071570B2 (ja) 複合のターゲット語に関する辞書データを決定するための装置及び方法
JP3360693B2 (ja) 顧客情報検索方式
JPS5995641A (ja) 文字変換装置
JP2595934B2 (ja) 仮名漢字変換処理装置
JP3288063B2 (ja) 可変長データの格納および参照システム
JPS6246029B2 (ja)
JPH0140370B2 (ja)
EP0649106A1 (en) Compactly stored word groups
JP2976682B2 (ja) 言語再生装置
JPH0271362A (ja) 仮名漢字変換装置
JP2865446B2 (ja) 文章処理装置
JPS6198475A (ja) 日本語文章入力装置
JPS60231254A (ja) 仮名漢字変換方式
JPH0623973B2 (ja) 文字処理装置の頻度変更方式
JPH053617B2 (ja)
JPH0554145B2 (ja)
JPS59116835A (ja) 短縮入力機能付日本語入力装置
JPS59106029A (ja) カナ漢字変換装置
JPH0131229B2 (ja)