JPH033063A - 用途辞書 - Google Patents

用途辞書

Info

Publication number
JPH033063A
JPH033063A JP1138005A JP13800589A JPH033063A JP H033063 A JPH033063 A JP H033063A JP 1138005 A JP1138005 A JP 1138005A JP 13800589 A JP13800589 A JP 13800589A JP H033063 A JPH033063 A JP H033063A
Authority
JP
Japan
Prior art keywords
usage information
information
usage
managed
dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1138005A
Other languages
English (en)
Other versions
JPH0760437B2 (ja
Inventor
Hideko Suehiro
末広 秀子
Ryoji Morita
盛田 良治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP1138005A priority Critical patent/JPH0760437B2/ja
Publication of JPH033063A publication Critical patent/JPH033063A/ja
Publication of JPH0760437B2 publication Critical patent/JPH0760437B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概要〕 日本語により記述される用途別の用途情報を規定の順序
に従って管理する用途別辞書における用途情報管理方式
に関し、 必要とされる辞書サイズのメモリ容量を削減できるよう
にすることを目的とし、 各用途情報が、先行する順位のものとして管理される用
途情報と先頭文字を起点とする共通部分があるのか否か
を、該共通部分の文字長を表示することで管理するよう
構成するとともに、この文字長が長さを有するものとし
て表示するときには、更に、共通部分に続く文字情報を
管理するよう構成する。
〔産業上の利用分野〕
本発明は、日本語により記述される用途別の用途情報を
規定の順序に従って管理する用途別辞書における用途情
報管理方式に関し、特に、必要とされる辞書サイズのメ
モリ容量を削減できるようにする用途別辞書における用
途情報管理方式に関するものである。
近年、辞書種類の多様化に伴い、1つのデータ処理シス
テム(例えばワードプロセッサ等)が複数の辞書を備え
てデータ処理を実行していくということが行われるよう
になってきている。このような状況下にあって、1つ1
つの辞書サイズが大きいと、全辞書の運用のために必要
となるメモリ容量が真人なものとなり、他の運用形態を
圧迫するということが起こることになる。これから、個
々の辞書の辞書サイズを可能な限り小さくしていくよう
な手段を講じていく必要がある。
【従来の技術) 住所や氏名等のような特定の用途情報を昇順に従って管
理するものとして用途別辞書がある。第4図に、住所辞
書を例にして、このような用途別辞書の従来技術の構成
を示す、ここで、この例では、住所辞書が、 「石川県河北郡宇ノ気町内日角」 という住所情報に続けて、 [石川県河北郡宇)気町大崎」 という住所情報を管理する例を想定している。
この図に示すように、従来の住所辞書では、各住所情報
を、「読み長」、「圧縮読み長」、「読み」、「JEF
長」及び「JEFコード」に従って管理するよう構成し
ていた。ここで、“JEF”というのは用いている日本
語のコード体系の識別名である0図中の■領域で管理さ
れている「石川県河北郡宇ノ気町大崎」の住所情報で具
体的に説明するならば、この「読み長」のエントリ欄に
は、「石川県河北郡宇ノ気町大崎」 の読み方である 「いしかわけんかほくぐんうのけまち おおさき」 の文字数“20”が登録され、「圧縮読み長」のエント
リ欄には、1つ手前の■領域で管理される「石川県河北
郡宇ノ気町内日角」 との共通する読み方部分である 「いしかわけんかほくぐんうのけまち」の文字数“16
″が登録され、「読み」のエントリ欄には、1つ手前の
住所情報と読み方の共通しない部分である“おおさき”
のコードが登録され、「JEF長」のエントリ欄には、
「石川県河北郡宇ノ気町大崎」の文字数の2倍の数であ
る“24′が登録され、そして、rJEFコード」のエ
ントリ欄には、「石川県河北郡宇ノ気町大崎」のコード
が登録されることになる。ここで、rJEF長」のエン
トリ欄で文字数の2倍を登録するのは、JEF”が日本
語の1文字を2バイトで表現しているからである。
このように、従来の住所辞書のような用途別辞書では、
管理している用途情報の読み方については共通部分のデ
ータ圧縮を図って辞書サイズの削減を図るようにしてい
た。
〔発明が解決しようとする課題〕
しかしながら、従来の用途別辞書では、rJEFコード
」のエントリ欄に関しては、共通部分があってもデータ
圧縮を図るというような構成が採られていなかった。す
なわち、第4図の例で具体的にみるならば、管理されて
いる住所情報である「石川県河北郡宇ノ気町内日角」と
[石川県河北郡宇)気町大崎」とで、「石川県河北郡宇
ノ気町」という共通部分がありながら、rJEFコード
」についてはデータ圧縮を図らずに、それぞれがそのま
まを管理するよう構成していたのである。
これから、複数の辞書を備えなくてはならないという状
況下にあって、辞書のために要するメモリ容量が増大し
てしまうことで、他の運用形態を圧迫するという問題点
が起きていた。
本発明はかかる事情に鑑みてなされたものであって、日
本語により記述される用途別の用途情報を規定の順序に
従って管理する用途別辞書において、用途情報について
もデータ圧縮を図るよう構成することで、従来技術の問
題点の解決を図ることを目的とするものである。
〔課題を解決するための手段〕
第1図は、本発明に係る用途別辞書により管理される用
途情報のデータフォーマ7)の原理構成図である。
図中、1は読み長管環部であって、管理する用途情報の
読み方の文字数を1バイトで管理するもの、2は圧縮読
み長管環部であって、先頭文字を起点とする先行する順
位の用途情報との読み方の共通部分の文字数を1バイト
で管理するもの、3は読み管理部であって、圧縮読み長
管環部2で管理されない用途情報中の読み方の非共通部
分の文字情報を例えばEBCDICコードで管理するも
の、4は用途情報長管理部であって、管理する用途情報
の日本語文字数に応じた値を1バイトで管理するもの、
5は圧縮用途情報長管理部であって、先頭文字を起点と
する先行する順位の用途情報との共通部分の日本語文字
数に応じた値を1バイトで管理するもの、6は用途情報
管理部であって、圧縮用途情報長管理部5で管理されな
い用途情報中の非共通部分の日本語情報を例えばJEF
コードで管理するものである。
位の用途情報と先頭文字を起点とする共通部分があると
きには、圧縮用途情報長管理部5は共通部分の日本語文
字数に応じた“O”でない数値を管理するとともに、用
途情報管理部6はその共通部分に続く日本語情報のみを
管理する。一方、管理される用途情報が先行する順位の
用途情報と先頭文字を起点とする共通部分がないときに
は、圧縮用途情報長管理部5は“0”を管理するととも
に、用途情報管理部6はその用途情報の日本語情報をす
べて管理する。
このように、本発明の用途別辞書では、先行する順位の
用途情報と共通部分があるときに、後続する用途情報の
用途情報管理部6は、その共通する日本語情報部分につ
いては管理しないようにすることから、従来技術に比べ
て更に小さなメモリ容量に従って用途情報を管理できる
ようになるのである。
〔作用〕
本発明では、管理される用途情報が先行する順〔実施例
〕 以下、住所辞書に従う実施例に従って、本発明の詳細な
説明する。
第2図に、本発明の実施例構成を示す。この実施例では
、上述した第4図と同様に、住所辞書が、「石川県河北
郡宇ノ気町内日角」 という住所情報に続けて、 「石川県河北郡宇ノ気町大崎」 という住所情報を管理する例を想定している6図中、第
1図で説明したように、1は読み長管環部、2は圧縮読
み長管環部、3は読み管理部、4は用途情報長管理部、
5は圧縮用途情報長管理部、6は用途情報管理部であり
、“a”の識別子の付くものは、前段の順位の住所情報
として管理される「石川県河北郡宇ノ気町内日角」に係
る管理部に関するものであり、一方、“b”の識別子の
付くものは、後段の順位の住所情報として管理される「
石川県河北郡宇ノ気町大崎」に係る管理部に関するもの
である。
この実施例に示すように、本発明では、前段の順位の住
所情報としての 「石川県河北郡宇ノ気町内日角」 を管理するために、読み長管環部laは、この住所情報
の読み方である [いしかわけんかほくぐんうのけまち うちひすみ」 の文字数“212を管理し、圧縮読み長管環部2aは、
この住所情報の1つ手前で管理される住所情報との共通
する読み方部分がないことを表すために文字数“0”を
管理し、読み管理部3aは、この住所情報の読み方をE
BCD I Cコードに従って管理し、用途情報長管理
部4aは、「石川県河北郡宇)気町内日角」の日本語数
の2倍の数であるJEFコード長の“26”を管理し、
圧縮用途情報長管理部5aは、この住所情報の1つ手前
で管理される住所情報との共通する日本語情報がないこ
とを表すためにJEFコード長の“θ″を管理し、用途
情報管理部6aは、この住所情報の「石川県河北郡宇ノ
気町内日角」の日本語情報をJEFコードに従って管理
する。
一方、後段の順位の住所情報としての 「石川県河北郡宇ノ気町大崎」 を管理するために、読み長管環部1bは、この住所情報
の読み方である 「いしかわけんかほくぐんうのけまち おおさき」 の文字数“20”を管理し、圧縮読み長管環部2bは、
この住所情報の1つ手前で管理される住所情報の「石川
県河北郡宇ノ気町内日角」との共通する読み方部分であ
る 「いしかわけんかほくぐんうのけまち」の文字数“16
”を管理し、読み管理部3bは、1つ手前で管理される
住所情報と読み方の共通しない部分である4おおさき”
をEBCDICコードに従って管理し、用途情報長管理
部4bは、[石川県河北郡宇)気町大崎」の日本語数の
2倍の数であるJEFコード長の′″24”を管理し、
圧縮用途情報長管理部5bは、1つ手前で管理される住
所情報の「石川県河北郡宇ノ気町内日角」との共通する
日本語情報部分である「石川県河北郡宇ノ気町」の日本
語数の2倍の数であるJEFコード長の“2G”を管理
し、用途情報管理部6bは、1つ手前で管理される住所
情報と共通しない日本語情報部分である「大崎」をJE
Fコードに従って管理する。
このように、本発明では、管理される住所情報が前段の
順位の住所情報と先頭文字を起点とする共通部分を存す
るときには、圧縮用途情報長管理部5はその共通部分の
日本語文字数に応じた数値を管理するとともに、用途情
報管理部6はその共通部分に続(日本語情報のみを管理
して、共通部分の日本語情報については管理しないよう
に構成するのである。そして、この住所情報の共通部分
が、前段よりも更に前の先行する順位の住所情報から発
生している場合にも、その発生元に続く順位の住所情報
の用途情報管理部6はその共通部分に続く日本語情報の
みを管理して、共通部分の日本語情報については管理し
ないように構成するのである。これから、住所情報の共
通する日本語情報部分を重複して管理しないで済むこと
になることから、従来技術に比べて、更に小さなメモリ
容量に従って住所情報を管理できるようになるのである
第2図の例で具体的に説明するならば、読み管理部3a
で21バイト、用途情報管理部6aで26バイト、読み
管理部3bで4バイト、用途情報管理部6bで4バイト
、それ以外の管理部で各々lハイドずつ必要になること
から、本発明に従って「石川県河北郡宇)気町内日角」
と「石川県河北郡宇ノ気町大崎」を管理すると計63バ
イトで済むことになるのに対して、第4図の従来技術の
方法では計81バイトとなり、18バイト分もメモリ容
量を削減できることになる。
第3図に、圧縮用途情報長管理部5及び用途情報管理部
6にデータ設定するためのフローチャートを示す。この
フローチャートに示すように、先ず最初に、圧縮用途情
報長管理部5に格納する圧縮JEFコード長く共通する
日本語情報部分として圧縮されることになるJEFコー
ド長)を初期化し、次に、1つ手前の直前単語のJEF
コードとこの次順位として管理される比較単語のJEF
コードが一致するのか否かを文字単位で判断して、一致
するときには圧縮JEFコード長をカウントアンプしな
がら、比較単語の文字位置を更新していくことで不一致
となる文字位置を求めるとともに、このときのカウント
アツプ値を圧41 J E Fコード長として圧縮用途
情報長管理部5に設定し、そして、設定された圧縮JE
Fコード長が“0”であるときには、比較単語のJEF
コードをそのまま用途情報管理部6に設定するとともに
、設定された圧1i1JEFコード長が“0”でないと
きには、比較単語のJEFコード中の非共通部分である
非圧縮部分のみを用途情報管理部6に設定する。
〔発明の効果〕
以上説明したように、本発明によれば、辞書サイズのメ
モリ容量を大きく削減できるようになる。
これから、複数の辞書を使用するようなデータ処理シス
テムに対して、特に有効なものとなる。
【図面の簡単な説明】
第1図は本発明に係る用途別辞書により管理される用途
情報のデータフォーマントの原理構成図、第2図は本発
明の実施例構成図、 第3図は圧縮用途情報長管理部及び用途情報管理部にデ
ータ設定するためのフローチャート、第4図は従来技術
の説明図である。 図中、lは読み長管理部、2は圧Im読み長管理部、3
は読み管理部、4は用途情報長管理部、5は圧縮用途情
報長管理部、6は用途情報管理部である。

Claims (1)

  1. 【特許請求の範囲】 日本語により記述される用途別の用途情報を規定の順序
    に従って管理する用途別辞書において、各用途情報が、
    先行する順位のものとして管理される用途情報と先頭文
    字を起点とする共通部分があるのか否かを、該共通部分
    の文字長を表示することで管理するよう構成するととも
    に、 該文字長が長さを有するものとして表示するときには、
    更に、上記共通部分に続く文字情報を管理するよう構成
    することを、 特徴とする用途別辞書における用途情報管理方式。
JP1138005A 1989-05-31 1989-05-31 用途辞書 Expired - Lifetime JPH0760437B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1138005A JPH0760437B2 (ja) 1989-05-31 1989-05-31 用途辞書

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1138005A JPH0760437B2 (ja) 1989-05-31 1989-05-31 用途辞書

Publications (2)

Publication Number Publication Date
JPH033063A true JPH033063A (ja) 1991-01-09
JPH0760437B2 JPH0760437B2 (ja) 1995-06-28

Family

ID=15211835

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1138005A Expired - Lifetime JPH0760437B2 (ja) 1989-05-31 1989-05-31 用途辞書

Country Status (1)

Country Link
JP (1) JPH0760437B2 (ja)

Also Published As

Publication number Publication date
JPH0760437B2 (ja) 1995-06-28

Similar Documents

Publication Publication Date Title
US5812999A (en) Apparatus and method for searching through compressed, structured documents
US20040054692A1 (en) Method for compressing/decompressing a structured document
JP4003854B2 (ja) データ圧縮装置及び復元装置並びにその方法
JP6032292B2 (ja) 圧縮プログラム、圧縮装置、伸張プログラムおよび伸張装置
EP3236368A1 (en) Encoding processing program, encoding processing device, encoding processing method, decoding processing program, decoding processing device, and decoding processing method
US8463759B2 (en) Method and system for compressing data
JP6536243B2 (ja) 符号化プログラム、符号化装置、符号化方法、照合プログラム、照合装置および照合方法
US10404275B2 (en) Non-transitory computer readable recording medium, encoding method, creating method, encoding device, and decoding device
JP6507682B2 (ja) 符号化プログラム、符号化方法および符号化装置
JPH033063A (ja) 用途辞書
US9219497B2 (en) Compression device, compression method, and recording medium
US20210157818A1 (en) Computerized data compression and analysis using potentially non-adjacent pairs
US11323132B2 (en) Encoding method and encoding apparatus
JPH0546357A (ja) テキストデータの圧縮方法および復元方法
JP2774350B2 (ja) データ圧縮方法および圧縮データのデータ復元方法
JPS6255189B2 (ja)
CN111382162A (zh) 一种基于ai数据的结构化存储介质及其介质的读写方法
JP3190855B2 (ja) 圧縮データの復元方式
JPH0140370B2 (ja)
US20160210304A1 (en) Computer-readable recording medium, information processing apparatus, and conversion process method
JP2825960B2 (ja) データ圧縮方法及び復元方法
JPS61232724A (ja) 文字コ−ドデ−タの圧縮方式
JPH05158652A (ja) 辞書検索方法
JPH02297167A (ja) 文字列編集装置
JPH0573402A (ja) データ管理方式