JPH0456350B2 - - Google Patents

Info

Publication number
JPH0456350B2
JPH0456350B2 JP59238875A JP23887584A JPH0456350B2 JP H0456350 B2 JPH0456350 B2 JP H0456350B2 JP 59238875 A JP59238875 A JP 59238875A JP 23887584 A JP23887584 A JP 23887584A JP H0456350 B2 JPH0456350 B2 JP H0456350B2
Authority
JP
Japan
Prior art keywords
reading
pointer
kanji
entry
readings
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59238875A
Other languages
Japanese (ja)
Other versions
JPS61117657A (en
Inventor
Kazuaki Ookuma
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP59238875A priority Critical patent/JPS61117657A/en
Publication of JPS61117657A publication Critical patent/JPS61117657A/en
Publication of JPH0456350B2 publication Critical patent/JPH0456350B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、ワードプロセツサなどのかな漢字変
換処理を含む日本語情報処理装置に関するもので
あり、特に漢字を読みにしたがつてソート/マー
ジする際に使用される読み情報検索方式に関す
る。
[Detailed Description of the Invention] [Industrial Application Field] The present invention relates to a Japanese information processing device, such as a word processor, that includes a kana-kanji conversion process, and in particular, it relates to a Japanese information processing device that includes a kana-kanji conversion process, such as a word processor, and in particular, a method for sorting/merging kanji according to their readings. This paper relates to the reading information retrieval method used in the event.

〔従来の技術〕[Conventional technology]

日本語情報処理装置では、かな漢字変換結果の
候補文字リストあるいはシステム内漢字リストや
追加漢字リストなどの出力表示がしばしば行われ
る。
Japanese information processing devices often output and display a list of candidate characters as a result of kana-kanji conversion, a list of in-system kanji, a list of additional kanji, and the like.

漢字は、JISコードあるいはJEFコードなどに
よつてコード化されているが、一般に複数の漢字
を出力表示する場合、操作者が目的の漢字を容易
に認識できるようにするため、その配列は、コー
ド順ではなく、読み、画数、部首などの漢字属性
を用いて行われるのが普通である。
Kanji are encoded using JIS codes or JEF codes, but generally when outputting and displaying multiple kanji, the arrangement is coded so that the operator can easily recognize the desired kanji. This is usually done using kanji attributes such as reading, number of strokes, and radicals, rather than order.

漢字属性情報はテーブルの形で保持されてお
り、その1字当たりの情報量は、たとえば読みが
6種で36バイト(1種6バイト)、画数が1バイ
ト、部首が1バイトであり、読みが占める割合は
全体の94%にも達している。
Kanji attribute information is held in the form of a table, and the amount of information per character is, for example, 36 bytes for 6 readings (6 bytes for each type), 1 byte for the number of strokes, 1 byte for the radical, and so on. Reading accounts for 94% of the total.

第2図は、漢字の読みテーブルの構造を示した
ものである。この読みテーブルの各行は6個のエ
ントリ#1ないし#6で構成され、それぞれ1つ
の漢字の第1読みから第6読みまでが登録されて
いる。また行の縦方向配列は漢字コード順にした
がつている。この読みテーブルに収容される漢字
数がたとえば約3000文字であるとすれば、読みテ
ーブルの大きさは、 6(バイト)×6(エントリ)×3000(文字) =108Kバイトとなる。
FIG. 2 shows the structure of a kanji reading table. Each row of this reading table is composed of six entries #1 to #6, each registering the first to sixth readings of one kanji. The vertical arrangement of lines follows the order of kanji codes. If the number of kanji stored in this reading table is, for example, about 3000 characters, the size of the reading table is 6 (bytes) x 6 (entries) x 3000 (characters) = 108 Kbytes.

〔発明が解決しようとする問題点〕[Problem that the invention seeks to solve]

従来の漢字の読みテーブルは各漢字ごとの読み
の表示領域長が固定され、たとえば上記の例では
6種36バイトもの長さがあつた。しかし、複数の
読みを有する漢字であつても、その読みの数は2
〜3個が大部分であり、読みテーブルの半分以上
は空白となつて、メモリの利用効率を低下させる
という問題があつた。
In conventional kanji reading tables, the length of the display area for the reading of each kanji is fixed; for example, in the above example, the length was 36 bytes for six types. However, even if a kanji has multiple readings, the number of readings is 2.
The problem was that more than half of the reading table was blank, reducing memory usage efficiency.

〔問題点を解決するための手段〕 本発明は、上記問題点を解決するため、漢字の
読みだけを集めた読みテーブルと、漢字ごとに読
みテーブル中の該当する読みを指示するポインタ
を登録したポインタテーブルとの2段構成とする
ことにより、テーブルサイズの縮小化を図つたも
ので、その構成は、日本語情報処理装置におい
て、装置内に収容されている全ての漢字の読みを
一定の順序で配列した読みテーブル手段と、漢字
コード順に各漢字の全ての読みを表す上記読みテ
ーブル手段中の位置を示す1個または複数個の読
みポインタを配列した読みポインタテーブル手段
とをそなえ、入力された漢字コードに基づいて読
みポインタテーブル手段中の対応する読みポイン
タを読み出し、次に該読みポインタを用いて読み
テーブル手段中の対応位置からその読みを読み出
すことを特徴としている。
[Means for Solving the Problems] In order to solve the above problems, the present invention registers a reading table that collects only the readings of kanji and a pointer that indicates the corresponding reading in the reading table for each kanji. The table size is reduced by having a two-stage structure with a pointer table, and this structure allows Japanese information processing devices to read the readings of all kanji stored in the device in a fixed order. and a reading pointer table means having one or more reading pointers arranged to indicate positions in the reading table means representing all the readings of each kanji in the order of the kanji code. It is characterized in that the corresponding reading pointer in the reading pointer table means is read out based on the kanji code, and then the reading is read out from the corresponding position in the reading table means using the reading pointer.

〔発明の作用〕[Action of the invention]

第3図は本発明の概念を示したものである。図
において、31は読みポインタテーブル、32は
読みポインタエントリ列、33は読みポインタエ
ントリ、34は読みテーブル、35は読みエント
リである。
FIG. 3 shows the concept of the present invention. In the figure, 31 is a reading pointer table, 32 is a reading pointer entry string, 33 is a reading pointer entry, 34 is a reading table, and 35 is a reading entry.

本発明による読みテーブル34は、日本語情報
処理装置に収容されている全ての漢字の読みを取
り出して、たとえばEBCDICコード順に分類統合
したもので、各読みは、その出所の漢字コードか
ら切り離れた形でひととおりに整理されて登録さ
れている。したがつて、川(カワ)、皮(カワ)
などの異なる漢字の同じ読みは、全て1つの読み
“カワ”を示す。読みエントリ35に対応づけら
れるので、データ量の圧縮が可能となる。
The reading table 34 according to the present invention is obtained by extracting the readings of all kanji stored in a Japanese information processing device and sorting and integrating them, for example, in order of EBCDIC code, and each reading is separated from the kanji code of its source. They are organized and registered in a uniform manner. Therefore, river (kawa), skin (kawa)
All different kanji with the same reading, such as ``kawa'', have one reading. Since it is associated with the read entry 35, the amount of data can be compressed.

読みポインタテーブル31は、各漢字コードと
上記した読みテーブル34の各読みエントリとの
対応づけを行うためのもので、読みテーブル34
に対応するポインタすなわち読みポインタを漢字
コードごとに登録したものである。各読みポイン
タエントリ列32は別々の漢字コードに対応し、
漢字コード順に配列されている。たとえば「川」
については、“カワ”、“ガワ”“セン”の各読みに
対する読みポインタが読みポインタエントリ列3
2中に登録される。読みポインタの長さは、読み
の長さにくらべてはるかに短くて済ますことがで
きる。
The reading pointer table 31 is for associating each kanji code with each reading entry of the reading table 34 described above.
A pointer corresponding to the kanji code, that is, a reading pointer, is registered for each kanji code. Each reading pointer entry column 32 corresponds to a separate kanji code,
Arranged in order of kanji code. For example, "river"
For ``Kawa'', ``Gawa'', and ``Sen'', the reading pointers are in the reading pointer entry column 3.
Registered during 2nd. The length of the reading pointer can be much shorter than the reading length.

このようにして、漢字コードに対応する読みポ
インタテーブル31中の読みポインタエントリ列
をアクセスすることにより、登録されている読み
ポインタを順次読み出し、それを用いて読みテー
ブル34をアクセスし、その漢字の読みを全て取
り出すことができる。読みポインタテーブル31
と読みテーブル34とを合わせても、第2図に示
されている従来の読みテーブルよりも小さく構成
できる。
In this way, by accessing the reading pointer entry string in the reading pointer table 31 that corresponds to the kanji code, the registered reading pointers are sequentially read out, and the reading table 34 is accessed using them, and the reading pointer entry string of the reading pointer table 31 corresponding to the kanji code is accessed. You can extract all the readings. Reading pointer table 31
The combination of the reading table 34 and the reading table 34 can be made smaller than the conventional reading table shown in FIG.

〔実施例〕〔Example〕

以下に本発明の詳細を実施例にしたがつて説明
する。
The details of the present invention will be explained below with reference to Examples.

第1図は本発明の1実施例構成を示したもの
で、1は日本語情報処理装置、2は記憶装置、3
はテーブルアクセス制御部、4は漢字コード/ア
ドレス変換部、5は読みポインタテーブルポイン
タ、6は読みポインタエントリ選択部、7は読み
テーブルポインタ、8は読みポインタテーブル、
9は読みポインタエントリ列、10は読みポイン
タエントリ、11は読みテーブル、12は読みエ
ントリ、13は漢字コード入力、14は読みポイ
ンタ出力、15は読み出力を示している。
FIG. 1 shows the configuration of one embodiment of the present invention, where 1 is a Japanese language information processing device, 2 is a storage device, and 3 is a Japanese language information processing device.
is a table access control unit, 4 is a kanji code/address conversion unit, 5 is a reading pointer table pointer, 6 is a reading pointer entry selection unit, 7 is a reading table pointer, 8 is a reading pointer table,
9 is a reading pointer entry string, 10 is a reading pointer entry, 11 is a reading table, 12 is a reading entry, 13 is a kanji code input, 14 is a reading pointer output, and 15 is a reading output.

テーブルアクセス制御部3は、漢字コード入力
13に対して、読みポインタテーブブル8および
読みテーブル11をアクセス制御し、その漢字コ
ードが表す漢字について登録されている全ての読
みを読み出力15として取り出す。
The table access control unit 3 controls access to the reading pointer table 8 and the reading table 11 for the kanji code input 13, and extracts all the readings registered for the kanji represented by the kanji code as the reading output 15.

読みポインタテーブル8は、たとえば3000種の
文字(漢字コード)に対応して3000の読みポイン
タエントリ列9をもつている。各読みポインタエ
ントリ列9は、第1図で説明した従来例の読みテ
ーブルの場合と同様に各漢字ごとに最大6種の読
みを登録可能にするため、6個の読みポインタエ
ントリ10をそなえている。各読みポインタエン
トリの長さは、本実施例の場合2バイトで構成さ
れている。したがつて、各読みポインタエントリ
列の長さは12バイトとなり、さらに読みポインタ
テーブル全体では36Kバイトの大きさとなる。読
みポインタエントリの値は、読みテーブル11中
の読みエントリを直接ポイントしている。
The reading pointer table 8 has, for example, 3000 reading pointer entry columns 9 corresponding to 3000 types of characters (kanji codes). Each reading pointer entry column 9 has six reading pointer entries 10 in order to be able to register up to six different readings for each kanji, as in the case of the conventional reading table explained in FIG. There is. The length of each read pointer entry is composed of 2 bytes in this embodiment. Therefore, each read pointer entry string has a length of 12 bytes, and the entire read pointer table has a size of 36 Kbytes. The value of the reading pointer entry points directly to the reading entry in the reading table 11.

読みテーブル11は、本実施例の場合3000種の
文字から取り出された3170種の読みを登録したも
のであり、各読みエントリ12はEBCDICコード
順に配列されている。また1つの読みエントリ1
2の長さは6バイトであり、読みテーブル11の
全体の大きさは約20Kバイトとなつている。
In this embodiment, the reading table 11 registers 3170 types of readings extracted from 3000 types of characters, and each reading entry 12 is arranged in order of EBCDIC code. Another reading entry 1
2 is 6 bytes long, and the entire size of the reading table 11 is about 20 Kbytes.

動作においてテーブルアクセス制御部3は、漢
字コード入力13に応じて、漢字コード/アドレ
ス変換部4に指示して、漢字コードに対応する読
みポインタテーブル8のアドレスすなわち、テー
ブルの先頭位置から目的の読みポインタエントリ
列までのオフセツトを計算させ、結果を読みポイ
ンタテーブルポインタ5に設定させる。
In operation, the table access control unit 3 instructs the kanji code/address conversion unit 4 to convert the address of the reading pointer table 8 corresponding to the kanji code, that is, the target reading from the top position of the table, in response to the kanji code input 13. The offset to the pointer entry column is calculated, the result is read, and the result is set in the pointer table pointer 5.

次に読みポインタテーブルポインタ5の値によ
り読みポインタテーブル8をアクセスして、読み
出された読みポインタ出力14を、読みポインタ
エントリ選択部6に入力する。
Next, the read pointer table 8 is accessed based on the value of the read pointer table pointer 5, and the read pointer output 14 is input to the read pointer entry selection section 6.

読みポインタエントリ選択部6は、テーブルア
クセス制御部3からの指示に基づいて、読みポイ
ンタ出力14から読みポインタエントリ列9に含
まれている6個の読みポインタエントリ10の1
つを選択し、その値、すなわち読みポインタを読
みテーブブルポインタ7に設定する。ただし、読
みポインタエントリが空の場合には、次の読みポ
インタエントリを選択する。
The reading pointer entry selection unit 6 selects one of the six reading pointer entries 10 included in the reading pointer entry column 9 from the reading pointer output 14 based on instructions from the table access control unit 3.
Select one and set its value, that is, the reading pointer, in the reading table pointer 7. However, if the reading pointer entry is empty, the next reading pointer entry is selected.

次に読みテーブルポインタ7に設定された読み
ポインタにしたがつて、読みテーブル11をアク
セスし、該当する読みエントリの内容を読み出力
15として出力する。読みポインタエントリ選択
部6において、各読みポインタエントリを順次選
択することにより、入力された漢字コードに対応
する漢字の全ての読みを得ることができる。また
指示による1つの読みのみを選択出力することも
可能である。
Next, the reading table 11 is accessed according to the reading pointer set in the reading table pointer 7, and the contents of the corresponding reading entry are output as the reading output 15. By sequentially selecting each reading pointer entry in the reading pointer entry selection section 6, all the readings of the kanji corresponding to the input kanji code can be obtained. It is also possible to selectively output only one reading according to instructions.

第4図は読みポインタテーブル8の形式を示し
たもので、41はテーブル識別子、42および4
3はそれぞれテーブルの上限と下限を表示する収
容漢字の先頭漢字コードおよび最終漢字コードの
フイールドである。各読みポインタエントリ列9
内の6個の読みポインタエントリのうち最初の3
個は音読み用、後の3個は訓読み用として区別す
ることができる。
FIG. 4 shows the format of the reading pointer table 8, where 41 is the table identifier, 42 and 4
3 are fields for the first kanji code and the last kanji code of the accommodated kanji, which respectively display the upper and lower limits of the table. Each reading pointer entry column 9
The first 3 of the 6 reading pointer entries in
One can be distinguished as one for On-yomi, and the latter three for Kun-yomi.

第5図は読みテーブル11の形式を示したもの
で、51はテーブル識別子、52および53はそ
れぞれテーブルの上限と下限を表示する収容読み
の先頭オフセツトおよび最終オフセツトである。
読みエントリ12はEBCDICコードのカナ文字6
字以内で表示され、テーブル内に同じ読みは存在
しない。
FIG. 5 shows the format of the reading table 11, where 51 is a table identifier, and 52 and 53 are the beginning offset and the last offset of the accommodation reading, respectively, which indicate the upper and lower limits of the table.
Reading entry 12 is EBCDIC code kana character 6
It is displayed within the same number of characters, and the same reading does not exist in the table.

第6図は、読みポインタテーブル8と読みテー
ブル11の対応を具体例で示したものである。図
示の例は漢字「一」についてのものであり、読み
テーブル11には、この漢字の読みが、音読み
“イチ”,“イツ”と訓読み“ハジメ”“ヒトタビ”,
“ヒトツ”が登録されており、読みポインタテー
ブル8の該当する読みポインタエントリ列には、
読みテーブル11内の上記した各読みに対するオ
フセツト値ないしが、それぞれ設定されてい
る。なお、音読みは2個しかないため、空きの1
つの読みポインタエントリには“0”が設定され
る。
FIG. 6 shows a specific example of the correspondence between the reading pointer table 8 and the reading table 11. The example shown is for the kanji "ichi", and the reading table 11 shows the readings of this kanji: on-yomi "ichi", "itsu", kun-yomi "hajime", "hitotabi",
“Hitotsu” is registered, and in the corresponding reading pointer entry column of the reading pointer table 8,
Offset values for each of the above readings in the reading table 11 are set respectively. Please note that there are only two on-yomi readings, so use the empty one.
“0” is set in each reading pointer entry.

〔発明の効果〕〔Effect of the invention〕

以上のように本発明によれば、漢字コードから
読みを得るためのテーブルが従来よりも小さくで
きるため、必要なメモリペースも少なくて済み、
また読みの修正の大部分はテーブル中のポインタ
の張り替えで済ますことができる。
As described above, according to the present invention, the table for obtaining readings from kanji codes can be made smaller than before, so less memory space is required.
Also, most of the reading corrections can be done by changing the pointers in the table.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は本発明方式の1実施例装置の構成図、
第2図は従来の読みテーブルの説明図、第3図は
本発明方式の概念図、第4図は読みポインタテー
ブルの形式例を示す説明図、第5図は読みテーブ
ルの形式例を示す説明図、第6図は読みポインタ
テーブルと読みテーブルの対応の具体例の説明図
である。 図中、1は日本語情報処理装置、2は記憶装
置、3はテーブルアクセス制御部、4は漢字コー
ド/アドレス変換部、5は読みポインタテーブル
ポインタ、6は読みポインタエントリ選択部、7
は読みテーブルポインタ、8は読みポインタテー
ブル、9は読みポインタエントリ列、10は読み
ポインタエントリ、11は読みテーブル、12は
読みエントリを表す。
FIG. 1 is a configuration diagram of a device according to an embodiment of the present invention;
Fig. 2 is an explanatory diagram of a conventional reading table, Fig. 3 is a conceptual diagram of the method of the present invention, Fig. 4 is an explanatory diagram showing an example of the format of a reading pointer table, and Fig. 5 is an explanation showing an example of the format of the reading table. FIG. 6 is an explanatory diagram of a specific example of the correspondence between the reading pointer table and the reading table. In the figure, 1 is a Japanese information processing device, 2 is a storage device, 3 is a table access control unit, 4 is a kanji code/address conversion unit, 5 is a reading pointer table pointer, 6 is a reading pointer entry selection unit, 7
is a reading table pointer, 8 is a reading pointer table, 9 is a reading pointer entry string, 10 is a reading pointer entry, 11 is a reading table, and 12 is a reading entry.

Claims (1)

【特許請求の範囲】[Claims] 1 日本語情報処理装置において、装置内に収容
されている全ての漢字の読みを一定の順序で配列
した読みテーブル手段と、漢字コード順に各漢字
の全ての読みを表す上記読みテーブル手段中の位
置を示す1個または複数個の読みポインタを配列
した読みポインタテーブル手段とをそなえ、入力
された漢字コードに基づいて読みポインタテーブ
ル手段中の対応する読みポインタを読み出し、次
に該読みポインタを用いて読みテーブル手段中の
対応位置からその読みを読み出すことを特徴とす
る漢字読み情報検索方式。
1. In a Japanese information processing device, a reading table means that arranges the readings of all kanji stored in the device in a certain order, and a position in the reading table means that represents all the readings of each kanji in the order of the kanji code. reading pointer table means in which one or more reading pointers indicating the reading pointer are arranged, reads out the corresponding reading pointer in the reading pointer table means based on the input kanji code, and then using the reading pointer. A kanji reading information retrieval method characterized by reading out the reading from a corresponding position in a reading table means.
JP59238875A 1984-11-13 1984-11-13 Retrieving system of kanji reading information Granted JPS61117657A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59238875A JPS61117657A (en) 1984-11-13 1984-11-13 Retrieving system of kanji reading information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59238875A JPS61117657A (en) 1984-11-13 1984-11-13 Retrieving system of kanji reading information

Publications (2)

Publication Number Publication Date
JPS61117657A JPS61117657A (en) 1986-06-05
JPH0456350B2 true JPH0456350B2 (en) 1992-09-08

Family

ID=17036558

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59238875A Granted JPS61117657A (en) 1984-11-13 1984-11-13 Retrieving system of kanji reading information

Country Status (1)

Country Link
JP (1) JPS61117657A (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100892032B1 (en) 2007-07-26 2009-04-07 안병권 Welding Beads and Similar Protrusions and Curved Surface Processing Equipment

Also Published As

Publication number Publication date
JPS61117657A (en) 1986-06-05

Similar Documents

Publication Publication Date Title
US4597056A (en) Language translator having circuitry for retrieving full words after single letter input
JPH0456350B2 (en)
JPS6255189B2 (en)
JP3021224B2 (en) Dictionary search device
JPH0638254B2 (en) Kana-Kanji conversion device
JPH02158865A (en) document evaluation system
JPS59125424A (en) Character processor
JPH0375960A (en) Character processing device frequency change method
JPS5814688B2 (en) Kanji-mixed sentence input device that sequentially displays homophones
JPH0797371B2 (en) Character data storage
JPH05233701A (en) Dictionary storage device
JPH03137768A (en) Document processor
JPH0113579B2 (en)
JPS58193576A (en) Character display electronic equipment
JPS60189572A (en) character processing device
JPH0225544B2 (en)
JPS62202259A (en) Documentation device
JPH0236988B2 (en)
JPH0157384B2 (en)
JPH0221023B2 (en)
JPH0157385B2 (en)
JPH0417544B2 (en)
JPS59144937A (en) Study retrieving device using fixed memory means
JPH06266768A (en) Retrieval system in electronic book and electronic book player
JPH0612536B2 (en) Kana-Kanji conversion method

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees