JPH06164406A - データ圧縮装置及びデータ圧縮方法 - Google Patents

データ圧縮装置及びデータ圧縮方法

Info

Publication number
JPH06164406A
JPH06164406A JP43A JP31894292A JPH06164406A JP H06164406 A JPH06164406 A JP H06164406A JP 43 A JP43 A JP 43A JP 31894292 A JP31894292 A JP 31894292A JP H06164406 A JPH06164406 A JP H06164406A
Authority
JP
Japan
Prior art keywords
data
data compression
procedure
compression
format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP43A
Other languages
English (en)
Inventor
Ryuichi Shiomi
隆一 塩見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP43A priority Critical patent/JPH06164406A/ja
Publication of JPH06164406A publication Critical patent/JPH06164406A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 【目的】 多種のデータが混在したデータに対して圧縮
効率のよい圧縮方法を選択して処理することができるデ
ータ圧縮装置を提供することを目的とする。 【構成】 フォーマット入力部11は、データ構造と最
適な圧縮方法とが記述されたフォーマットファイルを受
け入れ、フォーマット解析部12がフォーマットファイ
ルに記述されたデータ構造と圧縮法を解析する。データ
入力部13は、フォーマット解析部12で解析されたデ
ータ構造に従って、データを受け入れる。符号化部14
は、フォーマットファイルの指定する圧縮方法に従っ
て、入力されたデータを符号化しデータ圧縮を行ない、
出力部15から出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、受け取ったデータを圧
縮して出力するためのデータ圧縮装置の構成および、そ
のデータ圧縮方法に関するものである。
【0002】
【従来の技術】文字や音声あるいは画像などを取り扱う
情報処理の分野では、取り扱うデータ量の増大にともな
って、データを圧縮して記憶したり、伝送したりする方
法が用いられている。データ圧縮処理を行う従来のデー
タ圧縮装置の一例が、特開平3ー157021号公報に
示されている。図8は、当該公報に記載のデータ圧縮装
置で使用されるデータ構造(a)と圧縮方法を選択する
ための制御表(b)を示している。また、図9は、この
データ圧縮装置の動作フローを示している。両図を参照
して、このデータ圧縮装置は、データD2の先頭にデー
タ種別D1が与えられた送信データDを受取り、このデ
ータ種別情報D1をもとに制御表Tを検索する。そし
て、制御表Tの中からデータ種別D1に対応するデータ
圧縮技法種別T2を検出し、そのデータ圧縮技法種別T
2により処理を振り分け、該当するデータ圧縮方法によ
りデータを圧縮して送信する。
【0003】
【発明が解決しようとする課題】最近の情報処理装置
は、文字、画像、音声など種々のデータが組み合わされ
たデータを大量に取り扱う場合が多い。このため、デー
タ圧縮装置には、各データの種類に応じて圧縮効率の高
い圧縮方法を用いて短時間で圧縮処理を行うことが望ま
れる。
【0004】しかしながら、上記の従来のデータ圧縮装
置は、所定長のデータ毎にデータ種別が与えられる。こ
のために、同種のデータが連続する場合であっても、デ
ータ種別情報が与えられる度毎に制御表を検索し、デー
タ種別に応じた圧縮方法を検出しなければならず、この
検索処理のために圧縮処理時間がかかるという問題があ
った。
【0005】したがって、本発明は上記のような問題点
を解消するためになされたもので、多種類のデータが混
在したデータを効率よく圧縮処理することができるデー
タ圧縮装置を提供することを目的とする。
【0006】
【課題を解決するための手段】請求項1の発明に係るデ
ータ圧縮装置は、複数種類のデータを受取り、データの
種類に応じたデータ圧縮処理を行うもので、データの種
類と、この種類のデータに適するデータ圧縮方法の情報
を含むフォーマットデータを入力するための第1入力手
段と、複数種類のデータを入力するための第2入力手段
と、種々のデータ圧縮手順を保持するデータ圧縮手順保
持手段と、フォーマットデータによって与えられたデー
タ圧縮方法に対応するデータ圧縮手順をデータ圧縮手順
保持手段から選択し、第2入力手段から入力されたデー
タを圧縮符号化するデータ圧縮手段と、圧縮されたデー
タを出力する出力手段とを備えている。
【0007】請求項2の発明に係るデータ圧縮装置は、
さらに、データ圧縮手段によって圧縮符号化されたデー
タを復号化するための復号化手順を格納した復号化手順
格納手段と、フォーマットデータで与えられたデータ圧
縮方法に対応したデータ復号化手順を復号化手順格納手
段中から検索して抽出する復号化手順抽出手段と、復号
化手順抽出手段によって抽出された復号化手順を出力す
る復号化手順出力手段とを備えている。
【0008】請求項3の発明に係るデータ圧縮装置は、
さらに、データ圧縮手順保持手段に対して、新たなデー
タ圧縮手順を格納し、あるいは既存のデータ圧縮手順を
削除するためのデータ圧縮手順編集手段を備えている。
請求項4の発明にかかるデータ圧縮装置は、さらに、出
力手段から出力される圧縮データについて、所定のデー
タ領域の索引情報を作成するためのインデックス生成手
段と、インデックス生成手段によって作成された索引情
報を出力するためのインデックス出力手段とを備えてい
る。
【0009】請求項5の発明に係るデータ圧縮装置の出
力手段は、出力する圧縮データのポインタを生成し、イ
ンデックス生成手段は、圧縮データのポインタと、所定
のデータ領域の検索指標となるキーワードとを含む索引
情報を作成する。請求項6の発明に係るデータ圧縮方法
は、複数種類のデータに対して、そのデータの種類に適
したデータ圧縮処理を行うための方法であって、複数種
類の各々のデータに対して、データの種類と、この種類
のデータに適するデータ圧縮方法の情報とを含むフォー
マットデータを作成するステップと、種々のデータ圧縮
手順を用意するステップと、各データを取り出し、この
データに対応したフォーマットデータによって指定され
るデータ圧縮手順を選択するステップと、選択されたデ
ータ圧縮手順に従ってデータを圧縮符号化するステップ
と、圧縮されたデータを出力するステップとを備えてい
る。
【0010】
【作用】請求項1ないし請求項6の発明では、種々のデ
ータが混在した入力データに対して、データの種類と、
データの種類毎に適したデータ圧縮方法が指定されたフ
ォーマットデータが予め用意される。データ圧縮装置
は、このフォーマットデータを読み込み、さらにこのフ
ォーマットデータに含まれるデータの種別情報に従って
データを読み込む。そして、読み込んだデータに適した
データ圧縮方法の情報をフォーマットデータから検出
し、データ圧縮手順保持手段から該当するデータ圧縮手
順を選び出し、データ圧縮処理を行う。
【0011】また、請求項2の発明のデータ圧縮装置
は、データ圧縮されたデータとともに、このデータを復
号化するために必要な復号化手順、例えば復号化プログ
ラムを出力する。さらに、請求項3の発明のデータ圧縮
装置は、データ圧縮手順編集手段が新たなデータ圧縮手
順をデータ圧縮手順保持手段に登録し、また既存のデー
タ圧縮手順を削除する。
【0012】さらに、請求項4及び5の発明のデータ圧
縮装置は、インデックス生成手段が出力手段から出力さ
れる圧縮データの中の所定のデータ領域の索引情報を作
成する。この索引情報には、圧縮データのポインタと、
所定のデータ領域の検索指標となるキーワードとが含ま
れる。
【0013】
【実施例】以下、本発明の実施例について、図面を参照
しながら説明する。本発明のデータ圧縮装置は、データ
と、このデータの構造およびこのデータに適した圧縮方
法を記述したフォーマット情報とを受け取り、データを
圧縮して出力する装置である。本装置の説明に先立っ
て、入力情報となるデータとフォーマット情報について
説明する。
【0014】図3は、データファイル及びフォーマット
ファイルに各々格納された入力データとフォーマット情
報の一例を示す模式図である。これらのデータは、例え
ば磁気ディスク装置や上位装置のメモリにファイル化さ
れて格納されている。図3に示すように、データファイ
ル1には、カタカナ及びアルファベットの文字データと
画像領域の大きさを示す数字データとパソコンの形状を
表現した画像データが組み合わされたデータが格納され
ている。
【0015】また、フォーマットファイル2には、図示
のような情報が格納されている。フォーマットファイル
2の各行は、コロン(:)を挟んで、左側に読み込むデ
ータのタイプ、右側に読み込んだデータの圧縮法が記述
されている。このフォーマットファイル2の各行は、デ
ータファイル1の各行のデータに対応している。この対
応付けは、例えばデータファイルの各行の末尾に識別子
を挿入することによって行われる。
【0016】まず、第1行目のデータタイプ「wor
d」は、1つの単語データが入力されることを意味す
る。そして、その圧縮法は「huffman−j」であ
り、入力された単語データを2バイトを1文字とする全
角文字データからなるデータと見なし、各文字をハフマ
ン符号化することを意味する。2行目のデータタイプ
「word」は、1行目の「word」と同様に、1つ
の単語データが入力されることを意味する。その圧縮法
は「huffman−e」であり、入力された単語デー
タを1バイトを1文字とする半角文字データからなるデ
ータと見なし、各文字をハフマン符号化することを意味
する。
【0017】3行目のデータタイプ「number」
は、1つの数字データが入力されることを意味する。そ
の圧縮法は「bit 10」であり、これは10ビット
の整数値で符号化することを意味する。「bit 1
0」の右に記述されている「>width」は、入力さ
れる数字データを変数「width」に代入することを
意味する。
【0018】4行目のデータタイプ「number」
は、3行目の「number」と同様に、1つの数字デ
ータが入力されることを意味する。その圧縮法は「bi
t 12」であり、これは12ビットの整数値で符号化
することを意味する。「bit12」の右に記述されて
いる「> height」は、入力される数字データを
変数「height」に代入することを意味する。
【0019】5行目のデータタイプ「image」は、
画像データが入力されることを意味する。データタイプ
「image」は2つの引数「(width,heig
ht)」を指定することが出来る。第1引数は画像デー
タの横幅であり、第2引数は画像データの縦幅である。
ここで、第1引数は「width」であり、第2引数
は、「height」であることから、3行目、4行目
で入力された数字データが代入された変数「widt
h」と「height」の値を用いて、入力される画像
データの大きさが決定される。データタイプ「imag
e」に対する圧縮法は「MH」であり、これは入力され
た画像データをモディファイドハフマン符号化すること
を意味する。
【0020】このフォーマットファイル2は、例えば予
めユーザによって作成される。ユーザは、圧縮すべきデ
ータの種類に応じて最も圧縮効率の高い圧縮方法を選択
して、フォーマットファイルに書き込む。なお、この例
では、データファイルの各行毎のデータに対してフォー
マット情報を規定しているが、行単位ではなく、データ
の種別毎に規定してもよい。
【0021】次に、本発明の実施例について説明する。
図1は、本発明の第1の実施例によるデータ圧縮装置の
構成を示すブロック図である。図1において、11はフ
ォーマットファイルが入力されるフォーマット入力部で
あり、例えば磁気ディスク装置やメモリからフォーマッ
トファイルを読み込む。12はフォーマットファイルに
記述されたデータ構造と圧縮法を解析し、データ入力及
び符号化の制御を行なうフォーマット解析部である。1
3はフォーマット解析部12で解析されたデータ構造に
従ってデータが入力されるデータ入力部であり、具体的
には磁気ディスク装置やメモリからデータファイルを読
み込むものである。14はフォーマット解析部12の制
御に従い、入力されたデータを符号化しデータ圧縮を行
なう符号化部である。15は符号化されたデータを出力
する出力部であり、具体的には磁気ディスク装置やメモ
リなどに出力を行なうものである。
【0022】次に、第1実施例のデータ圧縮装置の動作
について説明する。図2は、第1実施例のデータ圧縮装
置の符号化手順を示すフローチャートである。図2を参
照して、最初に、データ構造が記述されたフォーマット
ファイル2が入力部11から入力される(ステップS3
1)。入力されたフォーマット情報はフォーマット解析
部12に引き渡される。
【0023】フォーマット解析部12は、フォーマット
ファイルの各行のデータタイプを読み込み、読み込まれ
たデータタイプが「word」や「number」な
ど、データ入力部13が読み込み可能なものか否かをチ
ェックする。予め用意したデータタイプの中に存在しな
いものは解析不能とし、その部分を出力して、符号化を
中止する(ステップS33、S38)。
【0024】また、データタイプが正しいと判断する
と、コロン(:)の次に記述された圧縮方法の情報を読
み込む。そして、この圧縮方法が符号化部14によって
処理可能なものであるか否かを判断する。もし、符号化
部14に用意された圧縮方法の中に存在しないものであ
れば、解析不能と判断し、その部分を出力して、符号化
処理を中止する(ステップS33、S38)。
【0025】フォーマットファイルの解析が終了する
と、フォーマット解析部12はデータ入力部13と符号
化部14にフォーマットファイルを引き渡す。データ入
力部13は、フォーマットファイルの解析結果に従って
データを読み込む(ステップS34)。データ入力部1
3で読み込まれたデータは符号化部14に引き渡され
る。
【0026】符号化部14は、引き渡されたデータにつ
いて、フォーマットファイルの圧縮方法の情報に従って
符号化処理を行う(ステップS35)。圧縮符号化され
たデータは、出力部15に引き渡される。出力部15
は、引き渡された符号化データを、磁気ディスクやメモ
リーなどに出力する(ステップS36)。
【0027】これら一連のデータ入力、符号化、出力処
理は全ての入力データが符号化されるまで繰り返し行わ
れる(ステップS37)。ここで、フォーマットファイ
ルの解析終了から出力ステップまでの処理を図3を参照
して具体的に説明する。まず、データ入力部13は、最
初に単語データとして「コンピュータ」を読み込む。次
に単語データとして「Computer」を読み込む。
次に数字データとして「640」を読み込み、これを変
数「width」に代入する。次に数字データとして
「400」を読み込み、これを変数「height」に
代入する。最後に変数「width」と「heigh
t」を参照し、横640、縦400の大きさのコンピュ
ータが描かれた画像データを読み込む。これらの入力デ
ータは、符号化部14に引き渡される。
【0028】符号化部14は、最初に、入力データ「コ
ンピュータ」を1文字が2バイトの全角文字データから
なる単語データと見なし、「コ」「ン」「ピ」「ュ」
「ー」「タ」の各文字をハフマン符号化する。次に入力
データ「Computer」を1文字が1バイトの半角
文字データからなる単語データと見なし、「C」「o」
「m」「p」「u」「t」「e」「r」の各文字をハフ
マン符号化する。次に入力データ「640」を10ビッ
トの整数データとして符号化する。次に入力データ「4
00」を12ビットの整数データとして符号化する。最
後に横640、縦400の画像データをモディファイド
ハフマン符号化する。これらの符号化されたデータは出
力部15に引き渡される。
【0029】出力部15は、引き渡された各符号化され
たデータの間に、各データの終了位置を示す符号(ター
ミネータ)を挿入し、磁気ディスク装置やメモリーに出
力する。また、図3のようなデータが複数存在する場合
には、それら全てのデータに対しデータ入力、符号化、
出力を繰り返し行う。
【0030】なお、本実施例では、ハフマン符号化やモ
ディファイドハフマン符号化などの圧縮法を用いた場合
について説明したが、文字置換や、ランレングス符号化
等、他の圧縮方式もフォーマット解析部12及び符号化
部14に登録することにより、使用することが可能であ
る。また、本実施例では、入力されるデータとして、文
字で表現される単語や数字、画像データだけであった
が、文章データや音声データ等の情報をフォーマット解
析部12及びデータ入力部13に登録しておくことによ
り、これらのデータを取り扱うことが可能である。
【0031】さらに、第1の実施例に対する上記の適用
例は、後述する全ての実施例に対しても同様に適用する
ことができる。次に、本発明の第2の実施例のデータ圧
縮装置について説明する。図4は第2の実施例によるデ
ータ圧縮装置の構成を示すブロック図であり、図1に示
す第1の実施例のデータ圧縮装置と同じ番号を付した構
成要素は第1の実施例の場合と同様の動作をなすもので
ある。図4に示す第2の実施例のデータ圧縮装置は、第
1の実施例のデータ圧縮装置に対して、さらに、復号化
方式辞書51と復号化プログラム生成部52と復号化プ
ログラム出力部53とを備えている。
【0032】復号化方式辞書51は、符号化されたデー
タの復号化を行う復号化方式を蓄積しており、具体的に
は復号化プログラムを格納した磁気ディスクやメモリ等
で構成される。復号化プログラム生成部52は、フォー
マット解析部12の指示によって、復号化方式辞書部5
1を検索し、圧縮された符号化データを復号するための
復号化プログラムを抽出する。
【0033】復号化プログラム出力部53は、復号化プ
ログラム生成部52で抽出された復号化プログラムを、
例えばROMや磁気ディスク、メモリーなどに出力す
る。さらに、第2の実施例のデータ圧縮装置の動作につ
いて説明する。このデータ圧縮装置の符号化手順は、第
1の実施例で示された符号化手順と同様であり、ここで
は、復号化プログラム生成部52及び復号化プログラム
出力部53の動作と、これに関連するフォーマット解析
部12の動作についてのみ説明する。
【0034】フォーマット解析部12は、フォーマット
ファイルの内容を解析し、データ構造とデータ構造中の
各要素に対する圧縮法を抽出する。フォーマット解析部
12は、第1の実施例と同様、解析結果をデータ入力部
13及び符号化部14に引き渡し、さらに復号化プログ
ラム生成部52にも引き渡す。復号化プログラム生成部
52は、フォーマットファイル内の圧縮方式情報に基づ
いて復号化方式辞書51を検索し、フォーマットファイ
ル内に記述された圧縮方式に対応する復号化方式に従っ
た処理を行うための復号化プログラムをすべて抽出す
る。そして、抽出した復号化プログラムは、復号化プロ
グラム出力部53から出力される。
【0035】以上の動作を図3を参照して具体的に説明
する。まず、フォーマットファイル2の1行目の圧縮方
式「huffman−j」に対し、復号化プログラム生
成部52は「huffman−j」復号化方式プログラ
ムを復号化方式辞書51から抽出する。次に、2行目の
圧縮方式「huffman−e」に対し、復号化プログ
ラム生成部52は「huffman−e」復号化方式プ
ログラムを復号化方式辞書51から抽出する。さらに同
様に、復号化プログラム生成部52は「bit 10」
復号化方式プログラム、「bit 12」復号化方式プ
ログラム及び「MH」復号化方式プログラムを復号化方
式辞書51から抽出する。
【0036】復号化プログラム生成部52は、これら復
号化方式プログラムを本データ圧縮装置の符号化手順と
同様の順に並べ、本データ圧縮装置で圧縮されたデータ
を復号できる復号化プログラムを生成する。復号化プロ
グラム生成部52は生成した復号化プログラムを復号化
プログラム出力部53に引き渡す。復号化プログラム出
力部53は、引き渡された復号化プログラムをROMや
磁気ディスク、メモリーなどに出力する。
【0037】この第2の実施例の場合、圧縮されたデー
タとともに復号化を行うための復号化プログラムが出力
されるため、この出力結果を使用する装置において圧縮
データの復号化を容易に行うことができる。さらに、本
発明の第3の実施例によるデータ圧縮装置について説明
する。図5は、第3の実施例のデータ圧縮装置の構成を
示すブロック図であり、図1と同じ番号を付した要素は
第1の実施例のデータ圧縮装置と同様の動作をなすもの
である。この第3の実施例のデータ圧縮装置は、第1の
実施例のデータ圧縮装置に対して、符号化方式辞書部6
1と符号化方式制御部62を付け加えたものである。
【0038】符号化方式辞書61は、符号化方式プログ
ラムを蓄積する辞書であり、具体的には磁気ディスクや
メモリーなどで構成される。符号化方式制御部62は、
符号化方式辞書61へのプログラムの登録・削除等を制
御するものである。次に、第3の実施例のデータ圧縮装
置の動作について説明する。本データ圧縮装置の符号化
手順は、第1の実施例で示された符号化手順と同様であ
り、ここでは、符号化方式制御部62の動作と、これに
関連するフォーマット解析部12の動作についてのみ説
明する。
【0039】フォーマット解析部12は、フォーマット
ファイル中の圧縮方式が存在することをチェックする
際、符号化方式辞書61を参照し、その圧縮方式の存在
の有無を判定する。符号化部14は、フォーマットファ
イル中の圧縮方式情報に基づいて符号化方式辞書61を
検索し、該当する圧縮方式プログラムを符号化方式辞書
61から抽出する。そして、この抽出した圧縮方式プロ
グラムを用いて入力されたデータを圧縮符号化する。
【0040】符号化方式制御部62は、ユーザーが本デ
ータ圧縮装置に新たな符号化方式を追加したり、あるい
は削除するための動作を行う。例えば、新しい圧縮法が
出来上がった場合、ユーザーは符号化方式制御部62を
介して符号化方式をプログラムとして符号化方式辞書6
1に登録することができる。また、使用しない符号化方
式が存在する場合には、ユーザーが符号化方式制御部6
2を介して符号化方式辞書61から削除することによ
り、データ圧縮装置の規模を小さくすることが出来る。
【0041】さらに、本発明の第4の実施例について説
明する。図6は、第4の実施例によるデータ圧縮装置の
構成を示すブロック図である。第4の実施例によるデー
タ圧縮装置の構成は、第1の実施例によるデータ圧縮装
置に、インデックス生成部71とインデックス出力部7
2が付加されたものであり、図1と同じ番号が付された
構成要素は、第1の実施例のデータ圧縮装置のものと同
様の動作をなすものである。なお、インデックスとは圧
縮処理された各データの位置や種別を示す索引データを
いう。
【0042】インデックス生成部71は、データ入力部
13から入力されたデータの中から、各種のデータの種
別を識別するためのキーワードとなるデータと、出力部
14で与えられた圧縮データへのポインタとからインデ
ックスを生成する処理を行う。インデックス出力部72
は、インデックス生成部71で生成されたインデックス
を、圧縮データと同様に、例えば磁気ディスクやメモリ
などに出力するものである。
【0043】次に、この第4の実施例のデータ圧縮装置
の動作について説明する。図7は、この実施例のデータ
圧縮装置の動作手順を示すフローチャートである。図7
において、符号化手順は、実施例1で示された符号化手
順と同様であり、ここでは、主として第1の実施例に対
して新たに付加されたインデックス生成動作について説
明する。
【0044】まず、フォーマットファイルの解析終了
後、フォーマット解析部12は、解析結果のフォーマッ
トファイルとともに、各データ種別の識別情報となるべ
きキーワードを各データ中から抽出するための指定方法
を記述したキーワード情報をデータ入力部13及び符号
化部14に出力する(ステップS32)。ここで、キー
ワード指定の方法としては、各データ領域の最初のデー
タをキーワードとする方法やフォーマットファイル中に
記述する方法などが適用される。
【0045】次に、データ入力部13はフォーマットフ
ァイルのデータ種別情報に従ってデータを読み込む。デ
ータ入力部13で読み込まれたデータは符号化部14と
インデックス生成部71に引き渡される。また、同時
に、フォーマット解析部12から与えられたキーワード
情報がインデックス生成部71に引き渡される(ステッ
プS34)。
【0046】符号化部14は、引き渡されたデータをフ
ォーマットファイルで指定された圧縮方式に従って圧縮
符号化を行う(ステップS35)。符号化されたデータ
は、出力部15に引き渡される。さらに、出力部15
は、引き渡された符号化データの間に、各データの終了
位置を示す符号を挿入し、磁気ディスク装置やメモリー
に出力する(ステップS36)。また、この時、出力さ
れた圧縮データへのポインタを生成し、インデックス生
成部71に出力する。
【0047】インデックス生成部71は、データ入力部
13から引き渡されたキーワード情報を用いて入力デー
タ中からキーワードを抽出する(ステップS85)。さ
らに、出力部15から引き渡された圧縮データへのポイ
ンタと抽出したキーワードとを1つの組とするインデッ
クスを生成し、インデックス出力部72に引き渡す(ス
テップS86)。
【0048】インデックス出力部72は、引き渡された
各インデックスをひとまとめにし、磁気ディスクやメモ
リーに出力する(ステップS87)。この第4の実施例
のデータ圧縮装置によって出力されるインデックスは、
復号化処理において、圧縮データのデータ識別情報とし
て用いられる。なお、上記した第1ないし第4の実施例
は、各々組み合わせて適用することができる。例えば、
第1の実施例のデータ圧縮装置に対して、第2の実施例
の復号化部生成機能を付加し、また、第4の実施例のイ
ンデックス生成機能を付加し、あるいはこの両者を付加
することが可能である。
【0049】さらに、第3の実施例のデータ圧縮装置に
対しても、上記と同様に第2及び第4の実施例の機能を
付加することが可能である。
【0050】
【発明の効果】以上のように、請求項1ないし請求項6
の発明のデータ圧縮装置及びデータ圧縮方法は、種々の
データが混在した入力データに対して、データの種類
と、データの種類毎に最適なデータ圧縮方法が指定され
たフォーマットデータを予め用意し、このフォーマット
データと種々のデータとを読み込み、読み込んだデータ
の最適なデータ圧縮方法をフォーマットデータから検出
し、データ圧縮手順保持手段から該当するデータ圧縮手
順を選び出してデータ圧縮処理を行うように構成したの
で、データの種類に対応した最適な圧縮方法を使用して
圧縮効率の高い圧縮データを短時間で得ることができ
る。
【0051】また、請求項2の発明のデータ圧縮装置
は、データ圧縮されたデータとともに、このデータを復
号化するために必要な復号化手順を出力するように構成
したので、この出力データを受け取って復号化する装置
の復号化処理が容易に行うことができる。さらに、請求
項3の発明のデータ圧縮装置は、データ圧縮手順編集手
段が新たなデータ圧縮手順をデータ圧縮手順保持手段に
登録し、また既存のデータ圧縮手順を削除するように構
成したので、データ圧縮手順の更新が容易となる。
【0052】さらに、請求項4及び5の発明のデータ圧
縮装置は、インデックス生成手段が出力手段から出力さ
れる圧縮データについて、所定のデータ領域の索引情報
を作成するように構成したので、この索引情報を使用す
ることによって復号化装置の処理が容易となる。
【図面の簡単な説明】
【図1】本発明の第1の実施例におけるデータ圧縮装置
の構成を示すブロック図である。
【図2】図1に示すデータ圧縮装置の動作手順を示すフ
ローチャートである。
【図3】本発明のデータ圧縮装置において使用されるフ
ォーマットファイルとデータファイルの内容の一例を示
す模式図である。
【図4】本発明の第2の実施例におけるデータ圧縮装置
の構成を示すブロック図である。
【図5】本発明の第3の実施例におけるデータ圧縮装置
の構成を示すブロック図である。
【図6】本発明の第4の実施例におけるデータ圧縮装置
の構成を示すブロック図である。
【図7】図6に示すデータ圧縮装置の動作手順を示すフ
ローチャートである。
【図8】従来のデータ圧縮装置で使用されるデータ構造
(a)と制御表(b)の内容を示す図である 。
【図9】従来のデータ圧縮装置の動作手順を示すフロー
チャートである。
【符号の説明】
1 データファイル 2 フォーマットファイル 11 フォーマット入力部 12 フォーマット解析部 13 データ入力部 14 符号化部 15 出力部 51 復号化方式辞書 52 復号化プログラム生成部 53 復号化プログラム出力部 61 符号化方式辞書 62 符号化方式制御部 71 インデックス生成部 72 インデックス出力部

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 複数種類のデータを受取り、データの種
    類に応じたデータ圧縮処理を行うデータ圧縮装置であっ
    て、 データの種類と、この種類のデータに適するデータ圧縮
    方法の情報を含むフォーマットデータを入力するための
    第1入力手段と、 複数種類のデータを入力するための第2入力手段と、 種々のデータ圧縮手順を保持するデータ圧縮手順保持手
    段と、 前記フォーマットデータによって与えられたデータ圧縮
    方法に対応するデータ圧縮手順を前記データ圧縮手順保
    持手段から選択し、前記第2入力手段から入力されたデ
    ータを圧縮符号化するデータ圧縮手段と、 圧縮された前記データを出力する出力手段とを備えた、
    データ圧縮装置。
  2. 【請求項2】 前記データ圧縮装置は、さらに、 前記データ圧縮手段によって圧縮符号化されたデータを
    復号化するための復号化手順を格納した復号化手順格納
    手段と、 前記フォーマットデータで与えられたデータ圧縮方法に
    対応したデータ復号化手順を前記復号化手順格納手段中
    から検索して抽出する復号化手順抽出手段と、 前記復号化手順抽出手段によって抽出された復号化手順
    を出力する復号化手順出力手段とを備えたことを特徴と
    する、請求項1記載のデータ圧縮装置。
  3. 【請求項3】 前記データ圧縮装置は、さらに、 前記データ圧縮手順保持手段に対して、新たなデータ圧
    縮手順を格納し、あるいは既存のデータ圧縮手順を削除
    するためのデータ圧縮手順編集手段を備えたことを特徴
    とする、請求項1記載のデータ圧縮装置。
  4. 【請求項4】 前記データ圧縮装置は、さらに、 前記出力手段から出力される圧縮データについて、所定
    のデータ領域の索引情報を作成するためのインデックス
    生成手段と、 前記インデックス生成手段によって作成された索引情報
    を出力するためのインデックス出力手段とを備えたこと
    を特徴とする、請求項1記載のデータ圧縮装置。
  5. 【請求項5】 前記出力手段は、出力する圧縮データの
    ポインタを生成し、 前記インデックス生成手段は、前記圧縮データのポイン
    タと、所定のデータ領域の検索指標となるキーワードと
    を含む索引情報を作成することを特徴とする、請求項4
    記載のデータ圧縮装置。
  6. 【請求項6】 複数種類のデータに対して、そのデータ
    の種類に適したデータ圧縮処理を行うためのデータ圧縮
    方法であって、 前記複数種類の各々のデータに対して、データの種類
    と、この種類のデータに適するデータ圧縮方法の情報と
    を含むフォーマットデータを作成するステップと、 種々のデータ圧縮手順を用意するステップと、 各データを取り出し、このデータに対応した前記フォー
    マットデータによって指定されるデータ圧縮手順を選択
    するステップと、 選択された前記データ圧縮手順に従って前記データを圧
    縮符号化するステップと、 圧縮された前記データを出力するステップとを備えた、
    データ圧縮方法。
JP43A 1992-11-27 1992-11-27 データ圧縮装置及びデータ圧縮方法 Pending JPH06164406A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP43A JPH06164406A (ja) 1992-11-27 1992-11-27 データ圧縮装置及びデータ圧縮方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP43A JPH06164406A (ja) 1992-11-27 1992-11-27 データ圧縮装置及びデータ圧縮方法

Publications (1)

Publication Number Publication Date
JPH06164406A true JPH06164406A (ja) 1994-06-10

Family

ID=18104714

Family Applications (1)

Application Number Title Priority Date Filing Date
JP43A Pending JPH06164406A (ja) 1992-11-27 1992-11-27 データ圧縮装置及びデータ圧縮方法

Country Status (1)

Country Link
JP (1) JPH06164406A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007079127A (ja) * 2005-09-14 2007-03-29 Nippon Telegr & Teleph Corp <Ntt> データ形式判別方法、信号符号化方法、それらの方法を用いた装置、プログラム、および記録媒体
JP2007516514A (ja) * 2003-11-07 2007-06-21 エクスプウェイ 構造化文書の圧縮および解凍方法
JP2015053594A (ja) * 2013-09-06 2015-03-19 富士機械製造株式会社 通信システム、電子部品装着装置及び通信システムの圧縮処理方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007516514A (ja) * 2003-11-07 2007-06-21 エクスプウェイ 構造化文書の圧縮および解凍方法
JP2007079127A (ja) * 2005-09-14 2007-03-29 Nippon Telegr & Teleph Corp <Ntt> データ形式判別方法、信号符号化方法、それらの方法を用いた装置、プログラム、および記録媒体
JP2015053594A (ja) * 2013-09-06 2015-03-19 富士機械製造株式会社 通信システム、電子部品装着装置及び通信システムの圧縮処理方法

Similar Documents

Publication Publication Date Title
US5812999A (en) Apparatus and method for searching through compressed, structured documents
AU702207B2 (en) Method of and apparatus for compressing and decompressing data and data processing apparatus and network system using the same
JP3305191B2 (ja) 文書管理装置及びデータ圧縮方法及びデータ復元方法
US8120516B2 (en) Data compression using a stream selector with edit-in-place capability for compressed data
US8131721B2 (en) Information retrieval method, information retrieval apparatus, and computer product
JP3859313B2 (ja) タグ文書の圧縮装置および復元装置,圧縮方法および復元方法,圧縮/復元装置および圧縮/復元方法並びに圧縮,復元もしくは圧縮/復元プログラムを記録したコンピュータ読み取り可能な記録媒体
EP0293161B1 (en) Character processing system with spelling check function
JPH09321633A (ja) 情報アドレス変換方法,情報アドレス変換装置および情報検索システム
US20030005001A1 (en) Data processing method, and encoder, decoder and XML parser for encoding and decoding an XML document
KR20080043304A (ko) 마크업 언어 데이터의 인코딩
US6871320B1 (en) Data compressing apparatus, reconstructing apparatus, and method for separating tag information from a character train stream of a structured document and performing a coding and reconstruction
JPH0817444B2 (ja) 画像データの符号化装置
CN101783788A (zh) 文件压缩、解压缩方法、装置及压缩文件搜索方法、装置
JP2003218703A (ja) データ符号化装置及びデータ復号装置
JP3865694B2 (ja) 構造化文書の木構造におけるパスの符号化および復号化方法
EP1990737B1 (en) Document transformation system
JPH06164406A (ja) データ圧縮装置及びデータ圧縮方法
US6629101B1 (en) Data processing method and apparatus, and storage medium
KR19990029119A (ko) 문서 정보 격납 장치 및 문서 정보 격납 방법 및 문서 정보 검색 장치 및 문서 정보 검색 방법 및 문서 정보 격납 프로그램을 기록한 기록 매체 및 문서 정보 검색 프로그램을 기록한 기록 매체
JP3253657B2 (ja) 文書検索方法
JPH06164407A (ja) データ伸長装置及びデータ伸長方法
JP4334955B2 (ja) 生物情報のロスレス符号化装置
JPH07282040A (ja) 日本語情報圧縮方式
JP3325326B2 (ja) 電子ファイリング装置
JPH0969785A (ja) データ圧縮方法及びデータ圧縮装置