JPH0456350B2 - - Google Patents
Info
- Publication number
- JPH0456350B2 JPH0456350B2 JP59238875A JP23887584A JPH0456350B2 JP H0456350 B2 JPH0456350 B2 JP H0456350B2 JP 59238875 A JP59238875 A JP 59238875A JP 23887584 A JP23887584 A JP 23887584A JP H0456350 B2 JPH0456350 B2 JP H0456350B2
- Authority
- JP
- Japan
- Prior art keywords
- reading
- pointer
- kanji
- entry
- readings
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Document Processing Apparatus (AREA)
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、ワードプロセツサなどのかな漢字変
換処理を含む日本語情報処理装置に関するもので
あり、特に漢字を読みにしたがつてソート/マー
ジする際に使用される読み情報検索方式に関す
る。
換処理を含む日本語情報処理装置に関するもので
あり、特に漢字を読みにしたがつてソート/マー
ジする際に使用される読み情報検索方式に関す
る。
日本語情報処理装置では、かな漢字変換結果の
候補文字リストあるいはシステム内漢字リストや
追加漢字リストなどの出力表示がしばしば行われ
る。
候補文字リストあるいはシステム内漢字リストや
追加漢字リストなどの出力表示がしばしば行われ
る。
漢字は、JISコードあるいはJEFコードなどに
よつてコード化されているが、一般に複数の漢字
を出力表示する場合、操作者が目的の漢字を容易
に認識できるようにするため、その配列は、コー
ド順ではなく、読み、画数、部首などの漢字属性
を用いて行われるのが普通である。
よつてコード化されているが、一般に複数の漢字
を出力表示する場合、操作者が目的の漢字を容易
に認識できるようにするため、その配列は、コー
ド順ではなく、読み、画数、部首などの漢字属性
を用いて行われるのが普通である。
漢字属性情報はテーブルの形で保持されてお
り、その1字当たりの情報量は、たとえば読みが
6種で36バイト(1種6バイト)、画数が1バイ
ト、部首が1バイトであり、読みが占める割合は
全体の94%にも達している。
り、その1字当たりの情報量は、たとえば読みが
6種で36バイト(1種6バイト)、画数が1バイ
ト、部首が1バイトであり、読みが占める割合は
全体の94%にも達している。
第2図は、漢字の読みテーブルの構造を示した
ものである。この読みテーブルの各行は6個のエ
ントリ#1ないし#6で構成され、それぞれ1つ
の漢字の第1読みから第6読みまでが登録されて
いる。また行の縦方向配列は漢字コード順にした
がつている。この読みテーブルに収容される漢字
数がたとえば約3000文字であるとすれば、読みテ
ーブルの大きさは、 6(バイト)×6(エントリ)×3000(文字) =108Kバイトとなる。
ものである。この読みテーブルの各行は6個のエ
ントリ#1ないし#6で構成され、それぞれ1つ
の漢字の第1読みから第6読みまでが登録されて
いる。また行の縦方向配列は漢字コード順にした
がつている。この読みテーブルに収容される漢字
数がたとえば約3000文字であるとすれば、読みテ
ーブルの大きさは、 6(バイト)×6(エントリ)×3000(文字) =108Kバイトとなる。
従来の漢字の読みテーブルは各漢字ごとの読み
の表示領域長が固定され、たとえば上記の例では
6種36バイトもの長さがあつた。しかし、複数の
読みを有する漢字であつても、その読みの数は2
〜3個が大部分であり、読みテーブルの半分以上
は空白となつて、メモリの利用効率を低下させる
という問題があつた。
の表示領域長が固定され、たとえば上記の例では
6種36バイトもの長さがあつた。しかし、複数の
読みを有する漢字であつても、その読みの数は2
〜3個が大部分であり、読みテーブルの半分以上
は空白となつて、メモリの利用効率を低下させる
という問題があつた。
〔問題点を解決するための手段〕
本発明は、上記問題点を解決するため、漢字の
読みだけを集めた読みテーブルと、漢字ごとに読
みテーブル中の該当する読みを指示するポインタ
を登録したポインタテーブルとの2段構成とする
ことにより、テーブルサイズの縮小化を図つたも
ので、その構成は、日本語情報処理装置におい
て、装置内に収容されている全ての漢字の読みを
一定の順序で配列した読みテーブル手段と、漢字
コード順に各漢字の全ての読みを表す上記読みテ
ーブル手段中の位置を示す1個または複数個の読
みポインタを配列した読みポインタテーブル手段
とをそなえ、入力された漢字コードに基づいて読
みポインタテーブル手段中の対応する読みポイン
タを読み出し、次に該読みポインタを用いて読み
テーブル手段中の対応位置からその読みを読み出
すことを特徴としている。
読みだけを集めた読みテーブルと、漢字ごとに読
みテーブル中の該当する読みを指示するポインタ
を登録したポインタテーブルとの2段構成とする
ことにより、テーブルサイズの縮小化を図つたも
ので、その構成は、日本語情報処理装置におい
て、装置内に収容されている全ての漢字の読みを
一定の順序で配列した読みテーブル手段と、漢字
コード順に各漢字の全ての読みを表す上記読みテ
ーブル手段中の位置を示す1個または複数個の読
みポインタを配列した読みポインタテーブル手段
とをそなえ、入力された漢字コードに基づいて読
みポインタテーブル手段中の対応する読みポイン
タを読み出し、次に該読みポインタを用いて読み
テーブル手段中の対応位置からその読みを読み出
すことを特徴としている。
第3図は本発明の概念を示したものである。図
において、31は読みポインタテーブル、32は
読みポインタエントリ列、33は読みポインタエ
ントリ、34は読みテーブル、35は読みエント
リである。
において、31は読みポインタテーブル、32は
読みポインタエントリ列、33は読みポインタエ
ントリ、34は読みテーブル、35は読みエント
リである。
本発明による読みテーブル34は、日本語情報
処理装置に収容されている全ての漢字の読みを取
り出して、たとえばEBCDICコード順に分類統合
したもので、各読みは、その出所の漢字コードか
ら切り離れた形でひととおりに整理されて登録さ
れている。したがつて、川(カワ)、皮(カワ)
などの異なる漢字の同じ読みは、全て1つの読み
“カワ”を示す。読みエントリ35に対応づけら
れるので、データ量の圧縮が可能となる。
処理装置に収容されている全ての漢字の読みを取
り出して、たとえばEBCDICコード順に分類統合
したもので、各読みは、その出所の漢字コードか
ら切り離れた形でひととおりに整理されて登録さ
れている。したがつて、川(カワ)、皮(カワ)
などの異なる漢字の同じ読みは、全て1つの読み
“カワ”を示す。読みエントリ35に対応づけら
れるので、データ量の圧縮が可能となる。
読みポインタテーブル31は、各漢字コードと
上記した読みテーブル34の各読みエントリとの
対応づけを行うためのもので、読みテーブル34
に対応するポインタすなわち読みポインタを漢字
コードごとに登録したものである。各読みポイン
タエントリ列32は別々の漢字コードに対応し、
漢字コード順に配列されている。たとえば「川」
については、“カワ”、“ガワ”“セン”の各読みに
対する読みポインタが読みポインタエントリ列3
2中に登録される。読みポインタの長さは、読み
の長さにくらべてはるかに短くて済ますことがで
きる。
上記した読みテーブル34の各読みエントリとの
対応づけを行うためのもので、読みテーブル34
に対応するポインタすなわち読みポインタを漢字
コードごとに登録したものである。各読みポイン
タエントリ列32は別々の漢字コードに対応し、
漢字コード順に配列されている。たとえば「川」
については、“カワ”、“ガワ”“セン”の各読みに
対する読みポインタが読みポインタエントリ列3
2中に登録される。読みポインタの長さは、読み
の長さにくらべてはるかに短くて済ますことがで
きる。
このようにして、漢字コードに対応する読みポ
インタテーブル31中の読みポインタエントリ列
をアクセスすることにより、登録されている読み
ポインタを順次読み出し、それを用いて読みテー
ブル34をアクセスし、その漢字の読みを全て取
り出すことができる。読みポインタテーブル31
と読みテーブル34とを合わせても、第2図に示
されている従来の読みテーブルよりも小さく構成
できる。
インタテーブル31中の読みポインタエントリ列
をアクセスすることにより、登録されている読み
ポインタを順次読み出し、それを用いて読みテー
ブル34をアクセスし、その漢字の読みを全て取
り出すことができる。読みポインタテーブル31
と読みテーブル34とを合わせても、第2図に示
されている従来の読みテーブルよりも小さく構成
できる。
以下に本発明の詳細を実施例にしたがつて説明
する。
する。
第1図は本発明の1実施例構成を示したもの
で、1は日本語情報処理装置、2は記憶装置、3
はテーブルアクセス制御部、4は漢字コード/ア
ドレス変換部、5は読みポインタテーブルポイン
タ、6は読みポインタエントリ選択部、7は読み
テーブルポインタ、8は読みポインタテーブル、
9は読みポインタエントリ列、10は読みポイン
タエントリ、11は読みテーブル、12は読みエ
ントリ、13は漢字コード入力、14は読みポイ
ンタ出力、15は読み出力を示している。
で、1は日本語情報処理装置、2は記憶装置、3
はテーブルアクセス制御部、4は漢字コード/ア
ドレス変換部、5は読みポインタテーブルポイン
タ、6は読みポインタエントリ選択部、7は読み
テーブルポインタ、8は読みポインタテーブル、
9は読みポインタエントリ列、10は読みポイン
タエントリ、11は読みテーブル、12は読みエ
ントリ、13は漢字コード入力、14は読みポイ
ンタ出力、15は読み出力を示している。
テーブルアクセス制御部3は、漢字コード入力
13に対して、読みポインタテーブブル8および
読みテーブル11をアクセス制御し、その漢字コ
ードが表す漢字について登録されている全ての読
みを読み出力15として取り出す。
13に対して、読みポインタテーブブル8および
読みテーブル11をアクセス制御し、その漢字コ
ードが表す漢字について登録されている全ての読
みを読み出力15として取り出す。
読みポインタテーブル8は、たとえば3000種の
文字(漢字コード)に対応して3000の読みポイン
タエントリ列9をもつている。各読みポインタエ
ントリ列9は、第1図で説明した従来例の読みテ
ーブルの場合と同様に各漢字ごとに最大6種の読
みを登録可能にするため、6個の読みポインタエ
ントリ10をそなえている。各読みポインタエン
トリの長さは、本実施例の場合2バイトで構成さ
れている。したがつて、各読みポインタエントリ
列の長さは12バイトとなり、さらに読みポインタ
テーブル全体では36Kバイトの大きさとなる。読
みポインタエントリの値は、読みテーブル11中
の読みエントリを直接ポイントしている。
文字(漢字コード)に対応して3000の読みポイン
タエントリ列9をもつている。各読みポインタエ
ントリ列9は、第1図で説明した従来例の読みテ
ーブルの場合と同様に各漢字ごとに最大6種の読
みを登録可能にするため、6個の読みポインタエ
ントリ10をそなえている。各読みポインタエン
トリの長さは、本実施例の場合2バイトで構成さ
れている。したがつて、各読みポインタエントリ
列の長さは12バイトとなり、さらに読みポインタ
テーブル全体では36Kバイトの大きさとなる。読
みポインタエントリの値は、読みテーブル11中
の読みエントリを直接ポイントしている。
読みテーブル11は、本実施例の場合3000種の
文字から取り出された3170種の読みを登録したも
のであり、各読みエントリ12はEBCDICコード
順に配列されている。また1つの読みエントリ1
2の長さは6バイトであり、読みテーブル11の
全体の大きさは約20Kバイトとなつている。
文字から取り出された3170種の読みを登録したも
のであり、各読みエントリ12はEBCDICコード
順に配列されている。また1つの読みエントリ1
2の長さは6バイトであり、読みテーブル11の
全体の大きさは約20Kバイトとなつている。
動作においてテーブルアクセス制御部3は、漢
字コード入力13に応じて、漢字コード/アドレ
ス変換部4に指示して、漢字コードに対応する読
みポインタテーブル8のアドレスすなわち、テー
ブルの先頭位置から目的の読みポインタエントリ
列までのオフセツトを計算させ、結果を読みポイ
ンタテーブルポインタ5に設定させる。
字コード入力13に応じて、漢字コード/アドレ
ス変換部4に指示して、漢字コードに対応する読
みポインタテーブル8のアドレスすなわち、テー
ブルの先頭位置から目的の読みポインタエントリ
列までのオフセツトを計算させ、結果を読みポイ
ンタテーブルポインタ5に設定させる。
次に読みポインタテーブルポインタ5の値によ
り読みポインタテーブル8をアクセスして、読み
出された読みポインタ出力14を、読みポインタ
エントリ選択部6に入力する。
り読みポインタテーブル8をアクセスして、読み
出された読みポインタ出力14を、読みポインタ
エントリ選択部6に入力する。
読みポインタエントリ選択部6は、テーブルア
クセス制御部3からの指示に基づいて、読みポイ
ンタ出力14から読みポインタエントリ列9に含
まれている6個の読みポインタエントリ10の1
つを選択し、その値、すなわち読みポインタを読
みテーブブルポインタ7に設定する。ただし、読
みポインタエントリが空の場合には、次の読みポ
インタエントリを選択する。
クセス制御部3からの指示に基づいて、読みポイ
ンタ出力14から読みポインタエントリ列9に含
まれている6個の読みポインタエントリ10の1
つを選択し、その値、すなわち読みポインタを読
みテーブブルポインタ7に設定する。ただし、読
みポインタエントリが空の場合には、次の読みポ
インタエントリを選択する。
次に読みテーブルポインタ7に設定された読み
ポインタにしたがつて、読みテーブル11をアク
セスし、該当する読みエントリの内容を読み出力
15として出力する。読みポインタエントリ選択
部6において、各読みポインタエントリを順次選
択することにより、入力された漢字コードに対応
する漢字の全ての読みを得ることができる。また
指示による1つの読みのみを選択出力することも
可能である。
ポインタにしたがつて、読みテーブル11をアク
セスし、該当する読みエントリの内容を読み出力
15として出力する。読みポインタエントリ選択
部6において、各読みポインタエントリを順次選
択することにより、入力された漢字コードに対応
する漢字の全ての読みを得ることができる。また
指示による1つの読みのみを選択出力することも
可能である。
第4図は読みポインタテーブル8の形式を示し
たもので、41はテーブル識別子、42および4
3はそれぞれテーブルの上限と下限を表示する収
容漢字の先頭漢字コードおよび最終漢字コードの
フイールドである。各読みポインタエントリ列9
内の6個の読みポインタエントリのうち最初の3
個は音読み用、後の3個は訓読み用として区別す
ることができる。
たもので、41はテーブル識別子、42および4
3はそれぞれテーブルの上限と下限を表示する収
容漢字の先頭漢字コードおよび最終漢字コードの
フイールドである。各読みポインタエントリ列9
内の6個の読みポインタエントリのうち最初の3
個は音読み用、後の3個は訓読み用として区別す
ることができる。
第5図は読みテーブル11の形式を示したもの
で、51はテーブル識別子、52および53はそ
れぞれテーブルの上限と下限を表示する収容読み
の先頭オフセツトおよび最終オフセツトである。
読みエントリ12はEBCDICコードのカナ文字6
字以内で表示され、テーブル内に同じ読みは存在
しない。
で、51はテーブル識別子、52および53はそ
れぞれテーブルの上限と下限を表示する収容読み
の先頭オフセツトおよび最終オフセツトである。
読みエントリ12はEBCDICコードのカナ文字6
字以内で表示され、テーブル内に同じ読みは存在
しない。
第6図は、読みポインタテーブル8と読みテー
ブル11の対応を具体例で示したものである。図
示の例は漢字「一」についてのものであり、読み
テーブル11には、この漢字の読みが、音読み
“イチ”,“イツ”と訓読み“ハジメ”“ヒトタビ”,
“ヒトツ”が登録されており、読みポインタテー
ブル8の該当する読みポインタエントリ列には、
読みテーブル11内の上記した各読みに対するオ
フセツト値ないしが、それぞれ設定されてい
る。なお、音読みは2個しかないため、空きの1
つの読みポインタエントリには“0”が設定され
る。
ブル11の対応を具体例で示したものである。図
示の例は漢字「一」についてのものであり、読み
テーブル11には、この漢字の読みが、音読み
“イチ”,“イツ”と訓読み“ハジメ”“ヒトタビ”,
“ヒトツ”が登録されており、読みポインタテー
ブル8の該当する読みポインタエントリ列には、
読みテーブル11内の上記した各読みに対するオ
フセツト値ないしが、それぞれ設定されてい
る。なお、音読みは2個しかないため、空きの1
つの読みポインタエントリには“0”が設定され
る。
以上のように本発明によれば、漢字コードから
読みを得るためのテーブルが従来よりも小さくで
きるため、必要なメモリペースも少なくて済み、
また読みの修正の大部分はテーブル中のポインタ
の張り替えで済ますことができる。
読みを得るためのテーブルが従来よりも小さくで
きるため、必要なメモリペースも少なくて済み、
また読みの修正の大部分はテーブル中のポインタ
の張り替えで済ますことができる。
第1図は本発明方式の1実施例装置の構成図、
第2図は従来の読みテーブルの説明図、第3図は
本発明方式の概念図、第4図は読みポインタテー
ブルの形式例を示す説明図、第5図は読みテーブ
ルの形式例を示す説明図、第6図は読みポインタ
テーブルと読みテーブルの対応の具体例の説明図
である。 図中、1は日本語情報処理装置、2は記憶装
置、3はテーブルアクセス制御部、4は漢字コー
ド/アドレス変換部、5は読みポインタテーブル
ポインタ、6は読みポインタエントリ選択部、7
は読みテーブルポインタ、8は読みポインタテー
ブル、9は読みポインタエントリ列、10は読み
ポインタエントリ、11は読みテーブル、12は
読みエントリを表す。
第2図は従来の読みテーブルの説明図、第3図は
本発明方式の概念図、第4図は読みポインタテー
ブルの形式例を示す説明図、第5図は読みテーブ
ルの形式例を示す説明図、第6図は読みポインタ
テーブルと読みテーブルの対応の具体例の説明図
である。 図中、1は日本語情報処理装置、2は記憶装
置、3はテーブルアクセス制御部、4は漢字コー
ド/アドレス変換部、5は読みポインタテーブル
ポインタ、6は読みポインタエントリ選択部、7
は読みテーブルポインタ、8は読みポインタテー
ブル、9は読みポインタエントリ列、10は読み
ポインタエントリ、11は読みテーブル、12は
読みエントリを表す。
Claims (1)
- 1 日本語情報処理装置において、装置内に収容
されている全ての漢字の読みを一定の順序で配列
した読みテーブル手段と、漢字コード順に各漢字
の全ての読みを表す上記読みテーブル手段中の位
置を示す1個または複数個の読みポインタを配列
した読みポインタテーブル手段とをそなえ、入力
された漢字コードに基づいて読みポインタテーブ
ル手段中の対応する読みポインタを読み出し、次
に該読みポインタを用いて読みテーブル手段中の
対応位置からその読みを読み出すことを特徴とす
る漢字読み情報検索方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59238875A JPS61117657A (ja) | 1984-11-13 | 1984-11-13 | 漢字読み情報検索方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59238875A JPS61117657A (ja) | 1984-11-13 | 1984-11-13 | 漢字読み情報検索方式 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS61117657A JPS61117657A (ja) | 1986-06-05 |
| JPH0456350B2 true JPH0456350B2 (ja) | 1992-09-08 |
Family
ID=17036558
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP59238875A Granted JPS61117657A (ja) | 1984-11-13 | 1984-11-13 | 漢字読み情報検索方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS61117657A (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100892032B1 (ko) | 2007-07-26 | 2009-04-07 | 안병권 | 용접 비드 및 유사 돌기부와 굴곡면 가공장치 |
-
1984
- 1984-11-13 JP JP59238875A patent/JPS61117657A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS61117657A (ja) | 1986-06-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US4597056A (en) | Language translator having circuitry for retrieving full words after single letter input | |
| JPH0456350B2 (ja) | ||
| JPS6255189B2 (ja) | ||
| JP3021224B2 (ja) | 辞書検索装置 | |
| JPH0638254B2 (ja) | 仮名漢字変換装置 | |
| JPH02158865A (ja) | 文書評価システム | |
| JPS63262750A (ja) | デ−タ入力方式 | |
| JPH0531190B2 (ja) | ||
| JPS59125424A (ja) | 文字処理装置 | |
| JPH01250166A (ja) | 漢字処理装置 | |
| JPS5814688B2 (ja) | 同音異義語順次表示を行なう漢字まじり文入力装置 | |
| JPH0623973B2 (ja) | 文字処理装置の頻度変更方式 | |
| JPH0797371B2 (ja) | 文字データ記憶装置 | |
| JPH05233701A (ja) | 辞書記憶装置 | |
| JPH03137768A (ja) | 文書処理装置 | |
| JPH0113579B2 (ja) | ||
| JPS58193576A (ja) | 文字表示電子機器 | |
| JPS60189572A (ja) | 文字処理装置 | |
| JPH0225544B2 (ja) | ||
| JPS62202259A (ja) | 文書作成装置 | |
| JPH0236988B2 (ja) | ||
| JPH0385670A (ja) | 二段階表示方式文書処理装置 | |
| JPH0157384B2 (ja) | ||
| JPH0221023B2 (ja) | ||
| JPH0157385B2 (ja) |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |