WO2001013237A1 - File processing method, data processing device and storage medium - Google Patents

File processing method, data processing device and storage medium Download PDF

Info

Publication number
WO2001013237A1
WO2001013237A1 PCT/JP1999/004387 JP9904387W WO0113237A1 WO 2001013237 A1 WO2001013237 A1 WO 2001013237A1 JP 9904387 W JP9904387 W JP 9904387W WO 0113237 A1 WO0113237 A1 WO 0113237A1
Authority
WO
WIPO (PCT)
Prior art keywords
section
data
file
compression
read
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/JP1999/004387
Other languages
English (en)
French (fr)
Inventor
Masahiro Kataoka
Takashi Tsubokura
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to PCT/JP1999/004387 priority Critical patent/WO2001013237A1/ja
Priority to CNB998169056A priority patent/CN1167014C/zh
Priority to EP99937058A priority patent/EP1211601A4/en
Priority to CA002387653A priority patent/CA2387653C/en
Priority to AU51977/99A priority patent/AU771959B2/en
Priority to KR1020027001931A priority patent/KR100597513B1/ko
Publication of WO2001013237A1 publication Critical patent/WO2001013237A1/ja
Priority to US10/073,245 priority patent/US7016908B2/en
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0608Saving storage space on storage systems
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0673Single storage device
    • G06F3/0674Disk device
    • G06F3/0677Optical disk device, e.g. CD-ROM, DVD
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99951File or database maintenance
    • Y10S707/99952Coherency, e.g. same view to multiple users
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99951File or database maintenance
    • Y10S707/99952Coherency, e.g. same view to multiple users
    • Y10S707/99953Recoverability

Definitions

  • the present invention relates to a file processing method, a data processing device, and a storage medium, and in particular, to a file processing method and a data processing device, in which a file is IBS-processed at a high compression ratio and stored in a storage medium and read out. It relates to a storage medium.
  • Information such as near dictionaries and encyclopedias is stored in advance on a storage medium such as a CD-ROM, and by accessing the CD-ROM with a computer, information such as dictionaries and encyclopedias can be read and displayed. Began to take place. This makes it possible to store enormous information such as dictionaries and hundreds of documents in one very compact CD-R ⁇ M. Also, instead of opening a dictionary or encyclopedia while using a computer to obtain 'B', instead of reading the 'B' from the CD-ROM, the trouble of obtaining the necessary body is greatly reduced. . Background art
  • a dictionary file consists of dictionary data and index data (hereinafter referred to as index data).
  • the dictionary data includes text data that explains the meaning of the word (hereinafter, text data).
  • text data For example, if the word is an animal, image data that shows the animal (hereinafter, image
  • voice data For example, if the word is a bird, the word includes a sound of the bird's sound (hereinafter referred to as voice data).
  • the index is used to detect a desired dictionary data from the dictionary file, and is provided for the dictionary data, and is sometimes called a keyword.
  • the index data includes a heading pointer, an item pointer, and the like.
  • the heading data includes headwords.
  • the item data includes headwords and solutions.
  • CD-ROMs since the storage capacity of CD-ROMs is relatively large, text data and in- Dexde is stored uncompressed on CD-ROM.
  • image data and the audio data have a particularly large amount of information of the image data, and are respectively compressed at an appropriate pressure and stored in the CD-ROM.
  • CD-ROM per dictionary
  • the use of data is inconvenient. Therefore, it is better to store information such as multiple dictionaries in one CD-ROM, but in this case, it is necessary to store There was a problem that the storage capacity of CD-R0M could be exceeded.
  • the dictionary file to be stored in the CD-ROM is a single dictionary or dictionary, if the amount of information in the dictionary file increases, even if the dictionary There was fg3 ⁇ 4 which could exceed the storage capacity of CD-ROM.
  • a telephone directory search system using a method similar to this has been proposed, but this method does not compress index data. This is because the amount of information in the index data is smaller than the information amount of telephone numbers-last name, first name, corporate name, etc. corresponding to the dictionary data, and even if compression is performed, the overall information efficiency does not improve much. For this reason, even if this proposed method is applied to the case where a job such as a dictionary is stored in a storage medium, the information compression efficiency of the entire dictionary file is not significantly improved. Therefore, conventionally, if the IffgS of the index data is relatively large compared to the information amount of the dictionary data, such as a dictionary or an encyclopedia, the dictionary file is efficiently stored in the storage medium. At the same time, dictionary files could not be accessed in a short time by relatively simple processing.
  • the general purpose is to provide a management method, a data processing device and a storage medium.
  • Another object of the present invention is to provide a compression step of dividing a file into a plurality of sections and compressing each section of the file using a plurality of compression parameters, and a storage step of storing the compressed file in a storage medium.
  • file processing methods including According to the present invention the data IBS rate can be greatly improved.
  • Still another object of the present invention is to further store a driver software as application software of a computer, wherein the i driver software decompresses the computer into an IS file read from a storage medium. It is another object of the present invention to provide a storage medium including a program provided with an extension processing means for causing the program to perform the extension processing. According to the present invention, there is no need to configure the application software according to each file, and it is possible to read and decompress a compressed file using existing application software by changing only the software.
  • Still another object of the present invention is to provide a file composed of a plurality of compression parameters and a plurality of section data which are divided into a number of sections or an original file by a plurality of parameters and compressed for each section.
  • a data processing device comprising: a read processing unit for controlling access to a medium; and a decompression processing unit for decompressing the section data read from the medium by the read processing section by IB parameters corresponding to the section data.
  • Still another object of the present invention is a storage medium storing information readable by a computer, wherein a plurality of original files are stored in a computer by a plurality of ffi parameters and a plurality of I i parameters.
  • Read processing means for controlling access to a medium in which a compressed file composed of a plurality of section data divided into sections and compressed for each section is stored; and read processing means for a computer and a read processing means.
  • a storage medium storing a program including decompression processing means for decompressing section data read from the medium by a compression parameter corresponding to the section data. According to the present invention, compression performed at a high data compression rate with a relatively simple configuration and processing The file can be extended well.
  • Another object of the present invention is a storage medium storing information readable by a computer, wherein a plurality of compression parameters and a plurality of ffiftl parameters are stored in a computer in response to a read request from application software.
  • the original file is divided into a plurality of sections, and read processing means for controlling access to a compressed file composed of a plurality of section data subjected to IBS for each section or eii, and a computer,
  • decompression processing means for decompressing the section data read from the mi medium by the read processing means according to the IBS parameters corresponding to the section data and supplying it to the application software.
  • FIG. 2 is a functional block diagram showing a file compression system constituted by the first embodiment of the data processing device
  • FIG. 6 is a diagram showing a data structure of a compression parameter.
  • Figure 10 is a diagram explaining the format of compressed data
  • FIG. 15 is a block diagram showing the configuration of a search / display control unit in a second embodiment of the data processing device according to the present invention.
  • FIG. 17 is a flowchart for explaining the read / decompression process.
  • a first embodiment of a file processing method and a data processing device uses the first embodiment of the storage medium according to the present invention.
  • the present invention is applied to a CD-ROM, but the storage medium itself is not limited to a CD-ROM, and the present invention is applied to an optical information storage medium other than a CD-ROM.
  • the present invention can be similarly applied to magnetic storage media such as a magneto-optical disk such as a magneto-optical disk and various types of memory devices.
  • the input device 4 is used to input instructions and data to the CPU 1, and the CPU 1 executes a program stored in the auxiliary storage device 3 based on these data and data, thereby performing processing requested by the user. I do.
  • the program stored in the auxiliary storage device 3 may be installed in advance, or may be loaded from the CD-ROM 6 a loaded on the CD-ROM input / output device 6.
  • the main storage device 2 is It is used to temporarily store intermediate results such as arithmetic processing and data used for arithmetic operations.
  • the display device 5 displays a result of the processing performed by the CPU 1 and a message prompting the user to input an instruction data. Instead of the display device 5 or in addition to the display device 5, a printer (not shown) that prints the result of the processing performed by the CPU 1 may be connected to the bus 9.
  • the file storage processing includes: 1) calculation processing for each parameter; data Ii processing such as indexing and text processing; address information calculation processing; IBS file synthesis processing; and J file storage processing.
  • the CD-ROM 6a stores a program that causes the CPU 1 to perform the final storage process.
  • the CPU 1 reads this program from the CD-ROM 6a by a well-known method. It shall be loaded into the auxiliary storage device 3.
  • a dictionary file such as a dictionary and a dictionary is sent from a host device (not shown) and stored in an auxiliary storage device 3 via a bus 9 or a CD-ROM input / output device 6 — CD different from ROM 6 a — Read from ROM and stored in auxiliary record 1S location 3 via node 9
  • the file system shown in FIG. 2 includes: l each file IBi control unit 11, a CD-ROM electronic publishing dictionary file 12, a compressed file 13, and data files 14, 15.
  • the file IBS control unit 11 is composed of the CPU 1 shown in FIG. 1, and includes a region division processing unit 21, an appearance transfer operation processing unit 22, a compression parameter overnight operation processing unit 23, a data compression processing unit 24, and an address information operation. It comprises a processing section 25 and a compressed file synthesis processing section 26.
  • the dictionary file 12 and the compressed file 13 are constituted by, for example, a CD-ROM 6a.
  • the data files 14, 15 are constituted by, for example, the auxiliary storage device 3.
  • the compression parameter processing section 23 calculates a plurality of compression parameters for each area of the dictionary file 12 by calculation and stores them in the data file 15.
  • the data processing unit 24 compresses the data in the dictionary file 12 based on each compression parameter, and stores the compressed data in the data file 15.
  • the address calculation unit 25 generates address information for each area of the dictionary file 12 and stores it in the data file 15.
  • the compressed finale combining processor 26 combines the data stored in the data files 14 and 15 to generate a compressed file and stores it in the compressed file 13.
  • FIGS. 3 and 4 are flow charts for explaining the area division processing section 21 and the output S operation processing section 22 of the file compression control section 11, that is, the area division processing and the emerging fiber operation processing performed by the CPU 1. It is one.
  • step S6 the file size of the dictionary file 12 is obtained, and in step S7, the dictionary file 12 is equally divided by! ⁇ S of the divided area.
  • step S8 initializes the output count in the area in the CPU 1 and the area of the appearance frequency count.
  • step S9 it is determined whether or not the area has changed and the processing has shifted to the processing of the new area. If the determination result is YES, the processing proceeds to step S10, and If the judgment is NO, the process proceeds to step S11. In step S10, the area / appearance power is switched to the new area / appearance power.
  • step S11 reads a 16-bit code corresponding to one character from the dictionary file 12.
  • step S12 the appearance frequency count of the appearance frequency counter of the corresponding code is incremented.
  • step S13 it is determined whether or not the ft ⁇ characters of the dictionary file 1 2 have been processed. If the determination is NO, the process returns to step S9.If the determination result is YES, the process proceeds to step S9. Proceed to S 14 to close dictionary file 12.
  • a step S27 sets an initial value of the compression pattern of the divided region having the largest bias.
  • step S28 the bias of the next divided area is It is determined whether it is similar to the evening. If the result of step S 28 is NO, step S 29 determines whether or not there is a remaining compression pattern. If the result is YE S, step S 30 returns to the corresponding division. Set the next value of the compression pattern in the area.
  • step S31 sets the value of the IBS pattern of the similar divided area in the corresponding divided area. I do.
  • step S32 determines whether or not it is the last divided area. If the result of step S32 is N0, the process returns to step S28; if the result of determination is YES, the process ends.
  • step S41 accesses CD-ROM 6a and opens a dictionary file.
  • a step S42 sets an initial value of the compression pattern, and a step S43 sets an initial value of the divided area.
  • step S44 it is determined whether or not the divided area to be processed belongs to the corresponding compression area, i.e., if the result is YES, the process proceeds to step S46, and the result is NO. If so, the process proceeds to step S45.
  • a step S45 skips the non-corresponding divided area.
  • step S46 a 16-bit code corresponding to one character is read.
  • step S47 the output count of the frequency counter of the corresponding 16-bit code is incremented, and in step S48, it is determined whether or not the last divided area has been processed. Is NO, the process returns to step S44. If the result of step S48 is YES, step S49 updates the compression pattern. In step S50, it is determined whether or not the R ⁇ IBg pattern has been processed. If the result is NO, the process returns to step S44.
  • a step S51 sets an initial value of the JBit pattern, and a step S52 initializes the divided area using the compression parameter of the corresponding pattern.
  • Become Step S53 is a 16-bit code. 4387 Sort in order of appearance ⁇ l, and step S54 selects 1024 16-bit codes in order of appearance frequency.
  • step S55 the remaining 16-bit code is decomposed into 8-bit codes, and its appearance ⁇ is calculated.
  • the frequency of occurrence of the 8-bit code is set to about 1 Z2, and correction is performed with the 16-bit code.
  • step S57 for example, the auxiliary storage device 3 is accessed, and the save file of the compression parameter is oven-stored in the data file 15.
  • step S58 the 1024 16-bit codes and their appearance ⁇ JS are written to the save file of the compressed parameters in the data file 15.
  • step S59 the 256 8-bit codes and their appearances ⁇ are written in a save file of the compressed parameters in the data file 15.
  • step S60 closes the save file of the compression parameters in the data file 15 and the step S61 updates the compression pattern.
  • step S62 it is determined whether or not the final compression pattern has been processed. If the result is N0, the process returns to step S52. If the result is YES, the process ends. I do.
  • FIG. 6 is a diagram showing the data structure of the parameters.
  • each compression parameter is composed of, for example, the appearance frequency of 256 kinds of 16-bit codes of 102 4 kinds and the appearance frequency of 256 kinds of 8-bit codes. It consists of 5 types of appearance frequency. The frequency of these occurrences will be a night for ⁇ and Human trees.
  • the IBi parameters in the case of the compression by the universal are composed of data such as a trie tree or an example of a registered symbol for generating the trie tree and its reference number.
  • FIG. 7 is a flowchart illustrating the data compression processing section 24 and the address information calculation processing section 25 of the finale compression control section 11, that is, the data compression processing and the address information calculation processing performed by the CPU 1. is there.
  • step S80 control 1tfg, compressed data, E0B, etc. are made to correspond to each flag and compression parameter S3 ⁇ 4IJ, and the process proceeds to step S81.
  • the section is a winter section
  • E0B is at the end of the section
  • ⁇ 0 ⁇ is not added and ⁇ is deleted from the control information ⁇ Include the deletion flag.
  • a step S81 writes the compressed data to a save file in the data file 15.
  • control information and ⁇ 0 ⁇ will be described in more detail with reference to FIGS. 9 and 10 described later.
  • a step S82 calculates address information in which the corresponding section is stored. For example, if the section has a fixed length, the address information is calculated based on the section number assigned to each section.
  • a step S83 writes the address information in the save file of the address information in the data file 15.
  • a step S84 decides whether or not the last section of the divided area has been processed, and if the decision result is NO, the process returns to the step S75. Whether or not the last section has been processed can be determined, for example, based on the section number or the last section added to the last section.
  • FIG. 8 is a flowchart for explaining the compressed file synthesizing process performed by the IBt file synthesizing unit 26 in the file efficiency control unit 11, that is, the CPU 1.
  • a step S91 opens the compressed file 13.
  • a step S92 edits the data of the header for identifying the head of the compressed file.
  • the compression parameter of the backup file in the data file 15 of the auxiliary storage device 3 is opened, and in step S94, the compression parameter of the backup file of the IBt parameter is stored in the JBt file 13. Copy.
  • a step S95 closes the save file of the IBS parameters.
  • Fig. 9 shows 1a) area division processing and appearance frequency calculation processing, 1 b) compression parameter overnight calculation processing, 1 c) data compression processing and address information calculation processing, and 1 d) as described above. It is a figure explaining composition of a compression file by compression file composition processing. In the figure,
  • FIG. 9 shows data, and shows a state in which each section is of variable length and subjected to IBS.
  • (d) shows the address If !! calculated for each section
  • (e) shows the result of combining ffi ⁇ , 'lame one night, padless dragon, and compressed data one night.
  • the management information S includes information used when searching for a compressed file, such as a dictionary file name, a dictionary file type, and a dictionary file compression type.
  • (f) indicates a compressed file to which a header and a trailer are added.
  • FIG. 10 is a view for explaining the format of compressed data in a compressed file.
  • a compression parameter which is a compression parameter for performing compression by Huffman coding in the present embodiment.
  • (b) shows the compressed data, and shows a state where each section is compressed with a variable length.
  • Each section is composed of control information, data, and EOB as shown in (c) of FIG.
  • the control information is composed of an EOB OBJ flag, an uncompressed flag, a compressed parameter type, and the like, as shown in FIG.
  • the EOB indicating the end of each section is, for example, 18 bits to 24 bits. However, if each section has a fixed length, the EOB can be set separately except for the ⁇ section.
  • an EOB deletion flag is provided to indicate whether EOB has been deleted. / JP99 / 04387. Also, in unusual sections with many words with low frequency of occurrence, compressed data may be longer than non-data. Therefore, in order to further improve the data efficiency in such a case, uncompressed data is stored in the compressed file instead of the compressed data as described above. The non-compliance flag indicates whether non-compressed data is stored instead of IBS data.
  • the compression parameter (or compression parameter identification number) is used for compression in the corresponding section, for example, 1 to! ! Shows one of the nS ⁇ IS parameters up to. Thereby, the compression parameter used for compression of each section can be known from the control information provided at the head of each section.
  • FIG. 11 is a functional block diagram showing a file search and display system configured according to the first embodiment of the data processing apparatus.
  • the same parts as those in FIG. 1 are denoted by the same ⁇ , and the description thereof will be described.
  • the file search / display system shown in FIG. 11 includes a large B search / display control unit 31, a compressed file 13, an input unit 33, and a search result display unit 35.
  • the display control unit 31 comprises the CPU 1 shown in FIG. 1, an input processing unit 41, a detection control unit 42, a read processing unit 43, 44, a decompression processing unit 45, and a display processing unit. It consists of four and six.
  • the Ei ⁇ file 13 is composed of, for example, CD-ROM 6a shown in FIG.
  • the input unit 33 includes the input device 4 shown in FIG.
  • the search result display section 35 is configured by the display device 5 shown in FIG.
  • the content and control sequence of each process are determined by the input processing unit 41 and the detection unit 42 based on the search mode, keyword, and the like input from the input unit 33.
  • the index pointer corresponding to the index data input from the input section 33 is read from the compressed file 13 by the read processing section 43, and the data of the index pointer is decompressed by the decompression processing section 45.
  • the text data of the corresponding text is read by the read processing unit 44 based on the value of the obtained index pointer, and the text data of the text is decompressed by the decompression processing unit 45.
  • the search result obtained by the above-mentioned search processing of ⁇ 3 ⁇ 4 is displayed on the search result display section 35 by the display processing section 46.
  • the file search and display processing consists of: index read processing and text read processing, which are executed by calling data decompression processing.
  • a program for causing the CPU 1 to perform a file display process is stored in the CD-ROM 6a for convenience of explanation lh, and the CPU 1 stores the program and the compressed file in a well-known manner.
  • Step SI 14 calls the decompression process, and decompresses the address of the upper index in the compressed file 13.
  • step S115 the address of the lower index of the next layer is acquired based on the above index data.
  • step S116 the decompression process is called, and the address of the lower index of the next layer in the compressed file 13 is expanded.
  • a step SI17 decides whether or not the extension of the address of the lowest index has been completed. If the decision is NO, the process returns to the step S115. On the other hand, if the decision result in the step SI17 is YES, the process ends.
  • FIG. 13 is a flowchart illustrating the data decompression process performed by the decompression processing unit 45 of the search and display control unit 31, that is, the CPU 1 shown in FIG.
  • the data decompression process is called by the index read process and the text read process.
  • step S 1 2 1 corresponds to the index input by the user through the input section 3 3.
  • the requested decompression address, data size, and storage area are stored in the auxiliary storage device 3 based on the data, and a storage area large enough for the decompressed data size is stored in the auxiliary storage device 3.
  • step S122 it is determined whether or not the compressed file 13 read from the CD-ROM 6a and read into the auxiliary storage device 3 has been oven-processed. If the determination result is NO, In step S123, the compressed file 13 in the auxiliary storage device 3 is oven-baked. In step S124, it is determined whether or not the header and the trailer are set, and the processing shifts to a well-known error processing in which the determination result is NO.
  • step S 124 reads the Efit parameter from the compressed file 13, and the appearance frequency of the 8-bit code in the compressed parameter And 16-bit code and its appearance frequency are read.
  • step S126 a Huffman tree corresponding to each of the plurality of compression parameters is created based on the appearance frequency of the 8-bit code and the appearance frequency of the 16-bit code. Proceed to 7. A flag for determining whether the data is an 8-bit code or a 16-bit code is added to the leaf data of the Huffman tree.
  • step S127 reads the address information corresponding to the requested decompression address from IBS file 13.
  • a step S128 reads the corresponding BB ⁇ data section from the EEii file 13 based on the address information.
  • step S129 it is determined whether or not the non-compression flag in the control information is set to ON. If the determination result in step S129 is YES, the process proceeds to step S132 described later, and if the determination result is NO, the process proceeds to step S130.
  • step S130 the section of the compressed data is decompressed by the Huffman tree corresponding to the type of compressed parameter in the control information, and in step S131, an 8-bit code or 16-bit code Based on the determination flag, the decompressed data is copied to the storage area, and the process proceeds to step S133.
  • the section is a section
  • E 0 B is ftSn at the end of the section, so the data of the variable-length section up to E 0 B is expanded and copied, and the section is a section other than the last section.
  • the control information includes an EOB deletion flag indicating that the EOB has been deleted.
  • the data in the fixed-length section is expanded and copied.
  • step S133 uncompressed data is copied to the storage area based on the flag for determining whether the code is an 8-bit code or a 16-bit code, and the process proceeds to step S133.
  • the section is the last section, since the EOB is added at the end of the section, the uncompressed data of the variable-length section up to the EOB is copied as it is, and if the section is an intermediate section other than the last section, Since the control information includes an EOB deletion flag indicating that E • B has been deleted, the uncompressed data of the fixed-length section of 2 kbytes is copied as it is.
  • step S133 the address information of the section is updated.
  • step S134 it is determined whether or not the required size of the compressed file 13 has been expanded. If the decision result in the step S134 is NO, a step S127 reads the address information corresponding to the extension address of the next section from the IBS file 13. Step S128 reads the corresponding compressed data section from the compressed file 13 based on the address information corresponding to the decompressed address in the next section, and the process proceeds to step S129. On the other hand, if the decision result in the step S134 is YES, the process ends.
  • step S141 counts an item in the expanded data based on the index data input from the input unit 33 by the user, which is the same as the index.
  • step S142 the value of the index item pointer is set to the address based on the input index data.
  • step S144 the data decompression process is called, and the routine for performing the data decompression process is read from the program for performing the file search process in the auxiliary storage device 3.
  • the text indicated by the item pointer, that is, the dictionary data is extended by one section.
  • Step S144 is to determine whether or not the dictionary data indicated by the item pointer has been completed. If the judgment is NO and the judgment is NO, step S145 sets the address of the next one section. Step S146 calls the decompression process to decompress the dictionary data indicated by the item pointer in the compressed file 13 for the next section, and the process proceeds to step S144.
  • a step S147 determines whether or not all the processes have been completed for all the items based on the input index data. If the decision result is NO, the process returns to step S142. If the decision result in the step S 147 is YES, a step S 148 displays the dictionary data expanded in all the items on the search result display section 35, and the process ends.
  • Step S148 may be performed before step S147.
  • the dictionary data expanded for each item is displayed on the search result display section 35 each time.
  • the description MLb and the section are of variable length. If the section is of variable length, the data decompression speed can be improved. This is because it is possible to set a section of appropriate length in accordance with the data segment and the segment, and there is no need to extend extra data.
  • the section has a fixed length
  • the data IB efficiency is good, and the address information can be restored from the ffifil file without storing the address information of the section in the compressed file. This is because a section has a fixed length and a section number is added to each section, so that a relative position of each section with respect to another section can be calculated.
  • the dictionary file can be specified.
  • Huffman is used for the data IS.
  • universal or the like can also be used, and if the data pressure 3 ⁇ 4t ⁇ at which dictionary data can be efficiently compressed with a common compression parameter for each section, Huffman ⁇ It is not limited.
  • the data used for data compression and decompression are not limited to dictionary data, but also include data in a database consisting of an index and data.
  • the compression algorithm used in the above embodiment improves the compression ratio by the normal 8-bit Huffman data compression process, and is used in a storage medium such as a CD-ROM or a hard disk described as an auxiliary storage device. ⁇ File area is reduced. Although the compression ratio is improved by the compression algorithm, the processing time for decompressing the IBS file is almost the same as that of ordinary Huffman code compression.
  • the second embodiment of the file processing and data processing apparatus uses the second embodiment of the storage medium according to the present invention.
  • the present invention is applied to a CD-ROM, but the storage medium itself is not limited to a CD-ROM, and the present invention is applicable to optical media other than the CD-ROM. It goes without saying that the present invention is similarly applicable to information storage media, magneto-optical storage media such as magneto-optical disks, magnetic storage media such as floppy disks, and various semiconductor memory devices.
  • Each configuration of the computer system adopting the second embodiment of the file processing method is as follows. This is the same as the block diagram shown in FIG. 1, and corresponds to the second embodiment of the data processing device.
  • the search / display control unit has a configuration as shown in FIG. In FIG. 15, the same parts as those in FIG. 11 are denoted by the same reference numerals, and the description thereof will be omitted.
  • the search and display control section is roughly composed of a CD-ROM application 51, an operating system (OS) 52, a random file manager (FM) 53, a serial file manager (FM) 54, and a CD-R 0M 6a driver software (DV) 55, driver software (DV) 56, 57 for hard disk 3a constituting auxiliary storage device 3 and display device 5 driver software (DV) 58 Consists of
  • the CD-ROM application 51 includes an application control unit 61, an input processing unit 62, a read processing unit 63, and a display processing unit 64.
  • the DV 55 incorporates a lead processing unit 71 corresponding to the read processing units 43 and 44 and the expansion processing unit 45 shown in FIG.
  • the application control unit 61 corresponds to the detection unit 42 shown in FIG. 11, and determines the content of each process and the control sequence.
  • the input processing unit 62 corresponds to the input processing unit 41 shown in FIG. 11, and inputs an operation mode and selects a target file.
  • the read / expansion processing unit 71 incorporated in the read processing unit 63 and DV 55 reads the corresponding compressed data from the compressed file 13 and decompresses it.
  • the display processing unit 64 corresponds to the display processing unit 46 shown in FIG.
  • the data stored in the compressed file 13 is not limited to the one including the indexes such as the dictionary and the dictionary as in the first embodiment and the actual data, but may be any data.
  • the data processing device constitutes a file control device.
  • the CD-ROM application 51 may be installed in the auxiliary storage device 3 in advance, or may be read from the CD-ROM 6a or the like and installed in the auxiliary storage device 3.
  • the DV 55 may be installed in the auxiliary storage device 3 in advance, or may be read from the CD-ROM 6a and installed in the auxiliary storage device 3. good.
  • Mlh, OS 52 and FM 53, 54 in the explanation are supplemented in advance. It is assumed that it is installed in the assistant memory device 3.
  • the second embodiment of the storage medium stores at least one of the compressed file 13 and the DV 55, and may further store the CD-ROM application 51.
  • FIG. 16 shows the read processing performed by the read processing section 63 of the CD-ROM application 51 together with the read / expansion processing section 71 of the DV 55, that is, the read processing of the CPU 1 shown in FIG. It is a flowchart explaining.
  • step S151 the read buffer in CPU1 is initialized.
  • step S152 the read address (logical address) of the compressed file 13 is set.
  • step S153 the read length of the section is set.
  • step S154 calls the read 'decompression process, and the process ends.
  • FIG. 17 is a flowchart for explaining the read 'decompression processing performed by the read'decompression processing unit 71 of the DV 55, that is, the read' decompression processing of the CPU 1 shown in FIG.
  • step S 161 the requested decompression address, data size, and storage area are stored in the auxiliary storage device 3 based on the index data input by the user from the input section 33, and decompression is performed. A storage area large enough for the set data size is prepared in the auxiliary storage device 3.
  • step S162 it is determined whether or not the compressed file 13 read from the CD-ROM 6a and loaded in the auxiliary storage device 3 is open. If the determination is NO, the process proceeds to step S162.
  • S163 opens the compressed file 13 in the auxiliary storage device 3.
  • step S164 it is determined whether or not the header and the trailer are set, and the process shifts to processing of a general file that is determined to be NO.
  • step S 16 4 reads the compressed parameters from the compressed file 13, and calculates the appearance frequency and 16 bits of the 8-bit code in the compressed parameters. Read the code and its frequency of occurrence.
  • Step S 1666 creates a Huffman tree corresponding to each of the plurality of compression parameters based on the appearance frequency of the 8-bit code and the appearance frequency of the 16-bit code, and the process proceeds to step S127, which will be described later. .
  • a flag for judging whether the code is an 8-bit code or a 16-bit code is added to the leaf data of the No and Fuman trees.
  • step S162 After the determination result of step S162 is YES or step S166, step S167 reads the address information corresponding to the requested decompression address from the EK file 13. A step S168 reads the corresponding compressed data section from the IS file 13. Based on the address information. In step S169, it is determined whether or not the non-compression flag in the control information is set to ON. If the decision result in the step S169 is YES, the process proceeds to a step S172 described later, and if the decision is NO, the process proceeds to the step S170.
  • Step S170 expands the section of the compressed data by the Huffman tree corresponding to the type of compressed parameter in the control information, and step S171 selects whether the code is an 8-bit code or a 16-bit code. Based on the determination flag, the decompressed data is copied to the memory area, and the process proceeds to step S173. In this case, if the section is the last section, since E0B is added at the end of the section, the data of the variable-length section up to E0B is expanded and copied, and the section is an intermediate section other than the last section. If so, the control information includes an EOB deletion flag indicating that the EOB has been deleted, so the data of the fixed-length section of 2 kbytes is expanded and copied.
  • step S 172 non-IB ⁇ data is copied to the storage area based on the flag for determining whether the code is an 8-bit code or a 16-bit code, and the process proceeds to step S 173.
  • the section is the last section, since the EOB is iiSUed at the end of the section, the uncompressed data of the variable-length section up to E0B is copied as it is, and the section is an intermediate section other than the last section.
  • the control information includes an EOB deletion flag indicating that E0B has been deleted, so the uncompressed data of the fixed-length section of 2 kbytes is copied as it is.
  • a step S 173 updates the address information of the section, and a step S 174 decides whether or not the expansion of the data size requested for the compressed file 13 is completed. If the decision result in the step S 174 is NO, the step S 167 follows the next section The address information corresponding to the decompressed address is read from the compressed file 13. In step S168, the corresponding section of the compressed data is read from the compressed file 13 based on the address information corresponding to the decompression address of the next section, and the process proceeds to step S169. On the other hand, if the decision result in the step S174 is YES, the process ends.
  • the CD-ROM application 51 using the CD-ROM 6a as an application has been described as an example.
  • the present invention is not limited to this, and the present invention can be applied to any application that handles files. It is possible to use the dryino soft toe air.
  • the read / expansion processing section 71 of the present invention is incorporated in the driver software for a CD-ROM.
  • driver software for other storage devices dry disk software for a hard disk drive, floppy drive not shown
  • the same processing can be performed by incorporating the read / decompression processing unit 71 into the driver software for the disk drive, etc., and the same effect can be obtained.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

明細書 ファイル処理方法、 データ処理装置及び記憶媒体 技術分野
本発明はファイル処 法、 データ処理装 び記憶媒体に係り、 特に高い圧 縮率でファィルを IBSして記憶媒体に格納して読み出すファィル処理方法及び データ処理装 ϋ¾びに圧縮されたファイルを格納する記憶媒体に関する。
近 辞書や百科辞典等の情報を予め C D - R ΟΜ等の記憶媒体に格納してお き、 コンピュータで C D— R OMをアクセスすることにより、 辞書や 典等 の情報を読み出して表示することが行われるようになった。 これにより、 辞書や 百^典等の膨大な情報を非常にコンパクトな 1枚の C D— R〇Mに格納できる。 又、 コンピュータを使用中に辞書ゃ丽事典等を開いて' な† Bを入手する代 わりに、 C D— R OMから ' な體を読み取れるので、 必 な體を入手する 手間が大幅に軽減される。 背景技術
辞書や百科辞典等の情報を格納した の C D— R OMでは、 辞書フアイルが 辞書データ及びインデックスのデータ (以下、 インデックスデータと言う) から なる。例えは ^^辞典の場合、 辞書データには、 語の意味を説明するテキストの データ (以下、 テキストデータと言う)、 例えば語が動物であればその動物を示 す画像のデータ (以下、 画像デ一夕と言う)、 例えば語が鳥であればその鳥の鳴 き声を示す音声のデ一夕 (以下、 音声データと言う)等が含まれる。 インデック スは、 辞書ファイルから所望の辞書デ一夕を検 るために使用されるもので、 辞書データに対して設けられており、 キーワードと呼ばれることもある。 イン デックスデータには、 見出しのポインタや項目のポインタ等が含まれる。 見出し のデータには、 見出し語が含まれる。 又、 項目のデータには、 見出し語や解 等が含まれる。
従来は、 C D— R OMの記憶容量力比較的大きいため、 テキストデータやイン デックスデ一夕は圧縮されずに C D— R OMに格納されている。 他方、 画像デ一 夕及び音声データは、 特に画像データの情報量が多いこともあり、 夫々適切な圧 ^¾で圧縮されて C D— R OMに格納されている。
しかし、 辞書毎ゃ丽辞典毎に 1枚の C D— R OMを 1»とするのでは、 データの使レ、勝手が悪い。 そこで、 1枚の C D - R OMに複数の辞書ゃ丽麟 等の情報を格納することか ましいが、 この場合、 格納するべき†^g*が、 デー夕を圧縮しても 1枚の C D— R 0 Mの記憶容量を越えてしまう可 t¾¾がある という問題があった。又、 C D - R OMに格納するべき辞書ファイルが単一の辞 書ゃ 辞典等のものであっても、 辞書ファイルの情報量が増大すれば、 辞書 デ一夕を圧縮しても 1枚の C D— R OMの記憶容量を越えてしまう可 fg¾もあつ た。
このため、 辞書データだけでなく、 インデックスデータを含 ファイクレ全 体を圧縮して C D— R OMに格納することが考えられるが、 比較的簡単な方法で 効率良く辞書フアイル全体を圧縮すると共に、 圧繊書ファィルを短時間で伸長 可能な方法は提案されていない。特に辞書ゃ丽辞典等の場合には、 インデック スデータの情報量が多いため、 辞書ファイルの伸長時にィンデックスデータを復 元する処理に時間がかかると、 所望のィンデックスデ一夕又は辞書データへのァ クセス時間が長くなり、 辞書ゃ„ 等の使レ、 カ くなつてしまう。 又、 例えば辞書データをィンデッタスの項目単位又は固定長単位で圧縮する場 合、 特に辞書ゃ 辞典等ではインデックスデータの情 が多いため、 上記と 同様に辞書ファイルの伸長時の処理に時間がかかってしまい、 辞書や百科辞典等 の使い勝手が悪くなつてしまう。例えば、 特開平 9一 2 6 9 6 9号^では、 こ れに類似する方法を用いた電話帳検索システムが提案されているが、 この提案方 法では、 インデックスデータは圧縮されない。 これは、 SIS帳の場合、 インデッ クスデ一タの情報量は、 辞書データに対応する電話番号-姓、 名、 法人名、 の情報量に比較すると小さく、 圧縮しても全体としての情報 効率があまり向 上しないからである。 このため、 この提案方法を辞書ゃ 頻等の職を記憶 媒体に格納する際に適用しても、 辞書ファイル全体としての情報圧縮効率はあま り向上しない。 従って、 従来は、辞書や百科辞典等のように、 インデックスデータの IffgSが 辞書デ一夕の情報量と比べても比較的大き 、場合、 辞書フアイルを効率良く Ι ϋ して記憶媒体に格納すると共に、 辞書ファィルを比較的簡単な処理により短 時間でアクセスすることができなかった。
そこで、 データ及びデータに対するインデックスデータを複数の区間に分割し て IBする方法が、例えば特許協力条約に基づいて公開された国際出願(国際出 願番号 P C TZJ P 9 8 , 0 4 7 3 6号、 国際公開番号 WO 9 9 / 2 1 0 9 2 号) の公開公報にて提案された。 この提案方法によると、 鶴ゃ丽辞典等のよ うに、 ィンデックスデータの情 IB か 書データの情幸 と比較して比較的大き レ、場合でも、 辞書ファイル等のファイルを効率良く圧縮して記赚体に格納する と共に、 圧縮辞書ファィル等の IBSファィルを比較的簡単な処理により短時間で アクセス可能となる。
し力、し、 上記従来方法及び上記提案方法によると、 検索の高速化のため、 s •伸長:^は、 ノ、フマン圧縮に基づく:^を採用していた。又、 単一の圧縮パラ メータを用いてデータの圧縮を行っていた。 このため、 以下の如き問題があった。 先ず、 辞書ゃ丽賴等のデータの IBSにハフマン を採用すると、 記憶媒 体に収録するべき語数が多くなり、 解説に用いられる語の種類が増加するに従つ て、 データ圧縮率が低下するという問題があった。
又、 デ一夕を腿したにも関わらず、 IBSデータの方が非 I Sデ一夕より 1f B 量が多くなつてしまう特異な区間も存在するという問題もあった。
更に、 データの各区間の末尾には、 区間の終了を示す終了情報を付加する必要 があるため、 全体としてのデータ圧縮率を大幅に向上するには限界があるという 問題もあった。
他方、辞書や 事典等のデータ以外のデータからなるファイルを圧縮する際 にも、 同様にしてデータ圧縮率を向上することが、 ファイル装^^の分野で望ま れている。 発明の開示
そこで、 本発明は、 上記の問題点を解決した、 新 且つ、 有用なファイル処 理方法、 データ処理装置及び記憶媒体を ¾^することを概括的目的とする。
本発明の他の目的は、 ファイルを複数の区間に分割して複数の圧縮パラメ一夕 を用いてファイルの各区間を圧縮する圧縮ステップと、 圧縮されたファイルを記 憶媒体に格納する格納ステップとを含むファイル処理方法を るにある。本 発明によれば、 データ IBS率を大幅に向上することができる。
本発明の更に他の目的は、 ファイルを複数の区間に分割して複数の圧縮パラ メータを用いてフアイルの各区間を IBSする IBi処理部と、 JE縮されたファイル を記憶媒体に格納する格納処理部とを備えたデータ処理装置を fil^するにある。 本発明によれば、 デ一夕処理装置のデータ圧縮率を大幅に向上することができる。 本発明の更に他の目的は、 コンピュータで読み取り可能な情報を格納した記憶 媒体であって、 コンピュータに、 ファイルを複数の区間に分割して複数の圧縮パ ラメ一夕を用いてファィルの各区間を IBSさせる IB¾処理手段と、 コンピュータ に、 圧縮されたファィルを記憶手段に格納させる格納処理手段とを備えたプログ ラムを格納した記憶媒体を提供するにある。本発明によれば、 コンピュータの データ IBi率を大幅に向上することができる。
本発明の更に他の目的は、 コンピュータで読み取り可能な情報を格納した記憶 媒体であって、 複数の区間に分割されたファイルが、 複数の圧縮パラメータを用 いて各区間が IBtされて記憶された領域と、 J JE縮パラメ一夕か 1£憶された領 域とを有する記憶媒体を難するにある。 本発明によれば、 データ圧縮率が大幅 に向上された圧縮ファィルを記憶媒体に格納することができる。
本発明の更に他の目的は、 コンピュータのアプリケーションソフトウエアとは したドライバソフトウヱァカ更に格納されており、 i ドライバソフトゥェ ァは、 コンピュータに、 記憶媒体から読み出された I Sファイルを伸長させる伸 長処理手段を備えたプログラムを含む記憶媒体を提供するにある。 本発明によれ ば、 アプリケーションソフトウェアを各 ファイルに合わせて構成する!^が なく、 ドライノくソフトウエアのみの変更により既存のアプリケーションソフト ウェアを用いても圧縮ファイルのリード ·伸長処理が可能となる。
本発明の他の目的は、 複数の圧縮パラメータと、 複数の EBiパラメ一夕により 原ファイルが複数の区間に分割され該区間毎に圧縮された複数の区間データとか ら構成される圧縮ファイルが された言^媒体にアクセスする読み出しステツ プと、 読み出しステップにより言 媒体から読み出される区間デ一夕を、 区間 データに対応する圧縮パラメ一夕により伸長する伸長ステップとを含むファイル 処理方法を提供するにある。 本発明によれば、 比較的簡単な構成及び処理で、 高 レ、データ圧縮率で I tされた圧縮ファィルを良好に伸長することができる。 本発明の更に他の目的は、 複数の圧縮パラメータと、 複数の バラメータに より原ファイルか 数の区間に分割され区間毎に圧縮された複数の区間データと から構成される ファィルが 1^された 媒体へのァクセスを制御するリ一 ド処理部と、 リード処理部により言 媒体から読み出される区間データを、 区間 データに対応する IB¾パラメ一夕により伸長する伸長処理部とを備えたデータ処 理装置を提供するにある。 本発明によれば、 比較的簡単な構成及び処理で、 高い デー夕圧縮率で圧縮された圧縮ファィルを良好に伸長することができる。
本発明の他の目的は、 アプリケーションソフトウエアからの読み出し要求に応 じて、 複数の パラメータと、 複数の パラメ一夕により原ファイル力複数 の区間に分割され区間毎に された複数の区間データとから構成される圧縮 ファイルが言 された 媒体へのアクセスを制御するリ一ド処理部と、 リ一ド 処理部により言 媒体から読み出される区間データを、 区間デー夕に対応する圧 縮パラメ一夕により伸長し、 該アプリケーションソフトウエアに供給する伸長処 理部とを備えたデータ処理装置を するにある。本発明によれば、 比較的簡単 な構 び処理で、 高いデ一夕 I i率で Efilされた IBiファイルを良好に伸長す ることができる。
本発明の更に他の目的は、 コンピュー夕で読み取り可能な情報を格納した記憶 媒体であって、 コンピュータに、 複数の ffi^パラメ一夕と、 複数の I iパラメ一 夕により原フアイルが複数の区間に分割され区間毎に圧縮された複数の区間デー 夕とから構成される圧縮ファイルが された言 媒体へのアクセスを制御させ るリード処理手段と、 コンピュー夕に、 リ一ド処理手段により 15 媒体から読み 出される区間データを、 区間データに対応する圧縮パラメ一夕により伸長させる 伸長処理手段とを備えたプログラムを格納した記憶媒体を するにある。本発 明によれば、 比較的簡単な構成及び処理で、 高いデータ圧縮率で圧縮された圧縮 フアイルを良好に伸長することができる。
本発明の他の目的は、 コンピュー夕で読み取り可能な情報を格納した記憶媒体 であって、 コンピュータに、 アプリケーションソフトウェアからの読み出し要求 に応じて、 複数の圧縮パラメ一夕と、 複数の ffiftlパラメ一夕により原ファイルが 複数の区間に分割され区間毎に IBSされた複数の区間データとから構成される圧 縮ファイルか eiiされた言 媒体へのアクセスを制御させるリ一ド処理手段と、 コンピュータに、 リード処理手段により mi 媒体から読み出される区間データ を、 区間データに対応する IBSパラメ一夕により伸長し、 アプリケーションソフ トゥヱァに供給させる伸長処理手段とを備えたプログラムを,した記憶媒体を 提供するにある。本発明によれば、 比較的簡単な構成及び処理で、 高いデ一夕圧 縮率で圧縮された ΕΕϋフアイルを良好に伸長することができる。
更に本発明の他の目的及び^ gは、 以下図面と共に述べる説明より明らかとな ろう。 図面の簡単な説明
図 1はフアイノレ処 法の第 1実施例を採用したコンピュータシステムの TO各 構成を示すブロック図、
図 2はデータ処理装置の第 1実施例にぉレ、て構成されるフアイル圧縮システム を示す機能ブロック図、
図 3は領域分割処¾¾び出現 ®g演算処理を説明するフローチャート、 図 4は領域分割処理及び出現頻度演算処理を説明するフローチヤ一ト、 図 5は ffi^、'ラメ一夕演算処理を説明するフローチャート、
図 6は圧縮パラメータのデータ構造を示す図、
図 7はデータ圧縮処理及びァドレス情報演算処理を説明するフローチヤ一ト、 図 8は圧縮ファィル合成処理を説明するフローチャート、
図 9は圧縮ファィルの合成を説明する図、
図 1 0は圧縮デ一夕の形式を説明する図、
図 1 1はデータ処理装置の第 1実施例において構成されるファイル検索 ·表示 システムを示す機能プロック図、 図 12はインデックスリード処理を説明するフローチャート、 図 13はデータ伸長処理を説明するフローチャート、
図 14はテキストリード処理を説明するフローチャート、
図 15は本発明になるデータ処理装置の第 2実施例における検索 ·表示制御部 の構成を示すブロック図、
図 1 6はファイルのリード処理を説明するフローチャート、
図 17はリード'伸長処理を説明するフローチャートである。 発明を実施するための最良の形態
本発明になるファイル処理方法及びデータ処理装置の第 1実施例を説明する。 フアイル処理方法及びデ一夕処理装置の第 1実施例は、 本発明になる記憶媒体の 第 1実施例を用いる。 尚、 記憶媒体の第 1実施例では、 本発明が CD— ROMに 適用されているが、 記憶媒体自体は CD— ROMに限定されず、 本発明は CD— ROM以外の光学的情報記憶媒^ 光磁気ディスク等の光磁気記 フロッ ピーディスク等の磁気記憶媒 各種 体メモリデバイス等にも同様に適用可 能であることは言うまでもない。
図 1は、 ファイル処理方法の第 1実施例を採用したコンピュータシステムの概 B各構成を示すブロック図であり、 データ処理装置の第 lU 例に対応する。 同図 中、 コンピュータシステムは、 : ^各バス 9により接続された中^ !t理装置 (CP U) 1、 ランダムアクセスメモリ (RAM)等からなる主記1^置 2、 ハード ディスクドライブ等からなる補助記憶装置 3、 キーボードやマウス等からなる入 力装置 4、表示装置 5及び CD— ROMドライブ等からなる C D— R OM入出力 装置 6からなる。 コンピュータシステムを構成する各要素自体は、 周知の構成の もので構成することができる。
入力装置 4は、 CPU 1に指示やデータを入力するのに用いられ、 CPU1は これらの やデータに基づレヽて補助記憶装置 3に格納されたプログラムを実行 することで、 ユーザの要求する処理を行う。補助記憶装置 3に格納されたプログ ラムは、 予めインストールされていても、 CD— ROM入出力装置 6にロードさ れた CD— ROM6 aからロードされても良い。主記憶装置 2は、 CPU1が行 う演算処理等の中間結果や演算に使用されるデータ等を一時的に格納するのに用 いられる。表示装置 5は、 CPU 1が行った処理の結果やユーザに指示ゃデ一夕 の入力を促すメッセ一ジを表示する。 尚、 表示装置 5に代えて、 又は、 表示装置 5に加えて、 CPU1が行った処理の結果等を印字するプリンタ (図示せず) を バス 9に接続しても良い。
先ず、 CD-ROM入出力装置 6にロードされた CD-ROM6 aに、 辞書や 辞典等の辞書ファィルを格納するフアイル格納処理にっレ、て説明する。 ファ ィル格納処理は、 l各騰パラメ一夕演算処理と、 インデックスやテキスト等の データ I i処理と、 アドレス情報演算処理と、 IBSファイル合成処理と、 J ファイル格納処理とからなる。本 HiiS例では、 説明の便宵ト.、 CD-ROM6 a は CPU 1にフアイノレ格納処理を行わせるプログラムが格納されており、 CPU 1は周知の方法でこのプログラムを CD— ROM6 aから読み取って補助記憶装 置 3にロードするものとする。又、 辞書ゃ丽辞典等の辞書ファイルは、 ホスト 装置(図示せず)から されてバス 9を介して補助記 tl¾置 3に格納されてい るか、 或いは、 CD— ROM入出力装置 6により CD— ROM6 aとは異なる C D— R OMから読み取られてノくス 9を介して補助記 1S¾置 3に格納されて 、るも のとする。
図 2は、 データ処理装置の第 1実施例において構成されるフアイノレ JBtシステ ムを示す機能ブロック図である。 同図中、 図 1と同 分には同一^を付し、 その説明は割各する。
図 2に示すフアイノレ システムは、 : l各フアイノレ IBi制御部 1 1と、 CD— ROM電子出版の辞書ファイル 12と、 圧縮ファイル 13と、 データファイル 1 4, 15とからなる。 ファイル IBS制御部 1 1は、 図 1に示す CPU1により構 成され、 領域分割処理部 21、 出現搬演算処理部 22、 圧縮パラメ一夕演算処 理部 23、 データ圧縮処理部 24、 ァドレス情報演算処理部 25及び圧縮フアイ ル合成処理部 26とからなる。 本実施例では、 辞書ファイル 12及び圧縮フアイ ル 1 3は、 例えば CD— ROM6 aにより構成さ " データファイル 14, 15 は、 例えば補助記憶装置 3により構成される。
領域分割処理部 21は、 辞書ファイル 12を複数の領域に分割し、 領域分割数 をデ一夕ファイル 1 4に格納する。 出 演算処理部 2 2は、 辞書ファイル 1 2の各領域の文字の出現繊を演算により求め、 領域■出 カウントをデー 夕ファイル 1 4に格納する。 又、 出現頻度演算処理部 2 2は、 各領域毎の文字の 偏りを演算により求め、 偏りフラグ、 偏りカウント等をデータファイル 1 4に格 納する。 尚、 分割領域の数は、 JB に用いる パラメータの種類の数の例えば 十数倍に設定される。
圧縮パラメ一夕演算処理部 2 3は、 辞書ファイル 1 2の各領域毎に、 複数の圧 縮パラメ一夕を演算により求め、 データファイル 1 5に格納する。 データ ffi^処 理部 2 4は、 各圧縮パラメ一夕に基づいて辞書ファイル 1 2のデータを圧縮して、 圧縮デ一夕をデ一夕ファイル 1 5に格納する。 アドレス體演算処理部 2 5は、 辞書ファイル 1 2の各領域毎にアドレス情報を生成して、 データファイル 1 5に 格納する。圧縮フアイノレ合成処理部 2 6は、 データファイル 1 4 , 1 5に格納さ れたデータを合成して圧縮ファイルを^ ¾して、 圧縮ファイル 1 3に格納する。
1 a )領域分割処¾¾び出現 演算処理:
図 3及び図 4は、 フアイル圧縮制御部 1 1の領域分割処理部 2 1及び出^ S 演算処理部 2 2、 即ち、 C P U 1が行う領域分割処¾¾び出現纖演算処理を説 明するフローチヤ一トである。
図 3において、 ステップ S 1は、 C D— R OM 6 aをアクセスして辞書フアイ ル 1 2をオーブンし、 ステップ S 2は、 入力装置 4からキー入力された圧縮パラ メータの数量を入力する。 ステップ S 3は、 入力装置 4からキー入力された辞書 ファイル 1 2の分割領域の を入力する。 ステップ S 4は、 領域のアドレスを 個別指定するか否かを判定し、 判定結果が Y E Sであると処理はステップ S 5へ 進み、判^果が NOであると処理はステップ S 6へ進む。 ステップ S 5は、 各 領域毎の先頭ァドレスを入力し、 処理はステップ S 8へ進む。
ステップ S 6は、 辞書ファイル 1 2のファイルサイズを獲得し、 ステップ S 7 は、 辞書ファイル 1 2を分割領域の! ¾Sで等分割する。 ステップ S 7又はステツ プ S 5の後、 ステップ S 8は、 C P U 1内の領域 ·出現頻度カウン夕の領域 '出 度カウントを初期化する。 ステップ S 9は、 領域が変わり新領域の処理に移 行したか否かを判定し、 判定結果が Y E Sであると処理はステップ S 1 0へ進み、 判 果が N Oであると処理はステップ S 1 1へ進む。 ステップ S 1 0は、 領域 •出現 力ゥン夕を、 新領域の領域 ·出現 力ゥン夕に切り換える。
ステップ S 1 0の後、 又は、 ステップ S 9の判定結果が NOであると、 ステツ プ S 1 1は、 辞書ファイル 1 2から 1文字に対応する 1 6ビットコードを読み出 す。 又、 ステップ S 1 2は、 該当コードの出現頻度カウン夕の出現頻度カウント をインクリメントする。 ステップ S 1 3は、 辞書ファイル 1 2の ft^文字を処理 したか否かを判定し、 判^果が NOであると処理はステップ S 9へ戻り、 判定 結果が Y E Sであると処理はステップ S 1 4へ進んで辞書ファイル 1 2をクロ一 ズする。
ステップ S 1 5は、各分割領域毎に 1文字を出現頻^!にソートし、 ステップ S 1 6は、 出現頻麵に例えば 1 0 2 4個の文字を選択する。 ステップ S 1 7は、 先頭分割領域の最高出^ Sの文字について初期化を行い、 ステップ S 1 8は、 該当文字の他の分割領域での出^ ¾と上記先頭分割領域での出現 ^¾とを比較 して出現 ^Jgの偏りを算出する。 ステップ S 1 9は、 出現 TOの偏りのある文字 が存在するか否かを判定し、 判定結果が Y E Sであると処理はステップ S 2 0へ 進み、 判 果が NOであると処理はステップ S 2 2へ進む。
ステップ S 2 0は、 偏りフラグを各分割領域の各文字毎にセットし、 ステップ S 2 1は、 偏りカウンタの偏りカウントを各分割領域毎にカウントアップする。 ステップ S 1 9の判定結果が N Oであるか、 或いは、 ステップ S 2 1の後、 ス テツプ S 2 2は、 次の出現頻度の文字に切り換える。 ステップ S 2 3は、 1 0 2 4番目の文字を超過したか否かを判定し、 判定結果が N 0であると処理はステッ プ S 1 8へ戻る。 他方、 ステップ S 2 3の判定結果が Y E Sであると、 ステップ S 2 4は、 次の分割領域に切り換え、 ステップ S 2 5は最終分割領域を超過した か否かを判定する。 ステップ S 2 5の判^果が NOであると、 処理はステップ S 1 8へ戻る。 ステップ S 2 5の判定結果が Y E Sであると、 ステップ S 2 6は、 偏りカウントに基づいて各分割領域をソートし、 処理は図 4に示すステップ S 2 7へ進む。
図 4において、 ステップ S 2 7は、 最も偏りの大きい分割領域の圧縮パターン の初期値をセットする。 ステップ S 2 8は、 次の分割領域の偏りが以前の圧縮パ 夕一ンと類似しているか否かを判定する。 ステップ S 2 8の判 果が NOであ ると、 ステップ S 2 9は、 圧縮パターンの残りがあるか否かを判定し、 判 果 が YE Sであると、 ステップ S 3 0は、 該当分割領域に圧縮パターンの次の値を セットする。
他方、 ステップ S 2 8の判定結果が YE S、 或いは、 ステップ S 2 9の判定結 果が NOであると、 ステップ S 3 1は、 該当分割領域に類似分割領域の IBSパ ターンの値をセットする。 ステップ S 3 0又はステップ S 3 1の後、 ステップ S 3 2は、 最終分割領域であるか否かを判定する。 ステップ S 3 2の判 果が N 0であると、 処理はステップ S 2 8へ戻り、 判定結果が Y E Sであると、 処理は 終了する。
1 b )圧縮ノ ラメ一夕演算処理:
図 5は、 フアイノレ IBt制御部 1 1の圧縮パラメ一夕演算処理部 2 3、 即ち、 C P U 1が行う圧縮パラメ一夕演算処理を説明するフローチヤ一トである。
図 5中、 ステップ S 4 1は、 C D— R OM 6 aをアクセスして辞書ファイルを オープンする。 ステップ S 4 2は、 圧縮パターンの初期値をセットし、 ステップ S 4 3は、 分割領域の初期値をセットする。 ステップ S 4 4は、 処理する分割領 域が該当圧縮ノ、'夕一ンに属するか否かを判定し、 判 果が Y E Sであると処理 はステップ S 4 6へ進み、 判^果が NOであると処理はステップ S 4 5へ進む。 ステップ S 4 5は、 非当該分割領域を飛ばす。
ステップ S 4 6は、 1文字に対応する 1 6ビットコ一ドを読み出す。 ステップ S 4 7は、該当 1 6ビットコードの出現頻度カウン夕の出 ¾®J度カウントをイン クリメントし、 ステップ S 4 8は、 最終分割領域を処理したか否かを判定し、 判 ^果が NOであると処理はステップ S 4 4へ戻る。 ステップ S 4 8の判 ^果 が YE Sであると、 ステップ S 4 9は、 圧縮パターンを更新する。 ステップ S 5 0は、: R^IBgパターンを処理したか否かを判定し、 判 果が NOであると処 理はステップ S 4 4へ戻る。
他方、 ステップ S 5 0の判定結果が Y E Sであると、 ステップ S 5 1は、 JBit パターンの初期値をセットし、 ステップ S 5 2は、 該当 パターンの圧縮パラ メ一夕を用いる分割領域を初期化する。 ステップ S 5 3は、 1 6ビットコ一ドを 4387 出現頻 ¾l にソートし、 ステップ S 5 4は、 1 0 2 4個の 1 6ビットコ一ドを出 現頻度順に選択する。 ステップ S 5 5は、 残りの 1 6ビットコ一ドについては、 8ビットコ一ドに分解して、 その出現^を算出する。 ステップ S 5 6は、 8 ビットコードの出現頻度を約 1 Z 2にして 1 6ビットコ一ドとの補正を行う。
ステップ S 5 7は、 例えば補助記憶装置 3をアクセスして圧縮パラメ一夕の退 避ファイルをデータファイル 1 5内にオーブンする。 ステップ S 5 8は、 1 0 2 4個の 1 6ビットコードとこれらの出現^ JSを、 データファイル 1 5内の圧縮パ ラメ一夕の退避ファイルに書き込む。又、 ステップ S 5 9は、 2 5 6個の 8ビッ トコードとこれらの出現 ^を、 データファイル 1 5内の圧縮パラメ一夕の退避 ファイルに書き込む。 ステップ S 6 0は、 デ一夕ファイル 1 5内の圧縮パラメ一 夕の退避ファイルをクローズし、 ステップ S 6 1は、 圧縮パターンを更新する。 ステップ S 6 2は、 最終圧縮バタ一ンを処理したか否かを判定し、 判 果が N 0であると処理はステップ S 5 2へ戻り、 判^果が YE Sであると処理は終了 する。
図 6は、 パラメ一夕のデータ構造を示す図である。 ハフマン による圧 縮の場合、 同図に示すように、 各圧縮パラメ一夕は、 例えば 1 0 2 4種の 1 6 ビットコ一ド毎の 2 5 6種の出現頻度及び 8ビットコ一ド毎の 2 5 6種の出現頻 度からなる。 これらの出現頻度は、 ノ、フマン木の^のためのデ一夕となる。 尚、 ユニバーサル による圧縮の場合の IBiパラメータはトライの木もしくはそれ を生成するための登録記号例とその参照番号等のデータで構成される。
1 c ) データ圧縮処理及びアドレス情報演算処理:
図 7は、 フアイノレ圧縮制御部 1 1のデータ圧縮処理部 2 4及びアドレス情報演 算処理部 2 5、 即ち、 C P U 1が行うデ一夕圧縮処理及びアドレス情報演算処理 を説明するフローチヤ一トである。
図 7中、 ステップ S 7 1は、 複数の圧縮バラメータから変換テ一ブル、 即ち、 本実施例ではハフマン圧縮を行うのでハフマン木を作成する。 ステップ S 7 2は、 C D— R OM 6 aにアクセスして辞書ファイル 1 2をオープンする。 ステップ S 7 3は、補助記憶装置 3にアクセスして圧縮データの退避フアイノレ及びアドレス 情報の退避ファイルをデータファイル 1 5内にオープンする。 ステップ S 7 4は、 P99/04387 先頭分割領域をセットする。
ステップ S75は、 辞書ファイル 12から 1区間を読み出す。 この区間は、 固 定長であっても、 可変長であっても良いが、 本実施例では可変長であるものとす る。 尚、 上言己区間は、 ブロックと呼ばれることもある。 ステップ S 76は、 ハフ マン木を用いて 1区間の圧縮データを演算する。 この圧縮データの演算の際には、 各分割領域に対応した圧縮パラメ一タを用いる。 ステップ S 77は、 1区間が固 定長であるか否かを判定し、 判定結果が N〇であると処理はステップ S 80へ進 む。 他方、 ステップ S 77の判^果が YESであると、 ステップ S 78は、 圧 縮データのサイズが圧縮前の非圧縮データのサイズより長いか否かを判定し、 判 ^果が NOであると処理はステップ S 80へ進む。 ステップ S 78の判^果 が YESであると、 ステップ S 79は、 データが非圧縮データであることを示す 非圧縮フラグを含む制御情報及び非圧縮データを生成して、 処理はステップ S 8 1へ進む。 この場合、 区間が 区間であれば、 区間の終わりに終了情報 (EO B: End Of B l ock)が ί¾Πさ 区間が 区間以外の途中区間 であれば、 EOBが i¾Uされない代わりに、 制御情報に EOBが削除されている ことを示す E 0 B削除フラグを含ませる。
ステップ S 80は、制御 1tfg、 圧縮データ、 E0B等を各フラグや圧縮パラ メータ S¾IJに対応させて^して、 処理はステップ S 81へ進む。 この場合、 区 間が慰冬区間であれば、 区間の終わりに E0Bが ¾Πさ 区間が最終区間以外 の途中区間であれば、 Ε0Βが付加されない代わりに、 制御情報に ΕΟΒが削除 されていることを示す ΕΟΒ削除フラグを含ませる。 ステップ S 81は、 圧縮 データをデータファイル 1 5内の退避ファイルに書き込む。
尚、 制御情報や Ε0Β等については、 後述する図 9及び図 1 0と共により詳細 に説明する。
ステップ S 82は、 該当区間が格納されるァドレス情報を演算する。 例えば区 間が固定長の場合、 ァドレス情報は各区間に付けられた区間番号に基づレヽて演算 される。 ステップ S 83は、 アドレス情報をデータファイル 1 5内のアドレス情 報の退避ファイルに書き込む。 ステップ S 84は、 当該分割領域の最終区間を処 理したか否かを判定し、 判定結果が NOであれば処理はステップ S 75へ戻る。 最終区間を処理したか否かは、 例えば区間番号や最終区間に付加された最終区間 に基づレ、て判定することができる。
他方、 ステップ S 8 4の判定結果が YE Sの場合、 ステップ S 8 5は、 分割領 域を更新し、 ステップ S 8 6は、 辞書ファイル 1 2の最終区間を処理したか否か を判定する。 ステップ S 8 6の判定結果が NOであると処理はステップ S 7 5へ 戻り、 判^果が YE Sであると処理はステップ S 8 7へ進む。 ステップ S 8 7 は、 圧縮デ一夕の退避ファイル及びァドレス情報の退避ファイルを夫々クローズ する。 又、 ステップ S 8 8は、 辞書ファイル 1 2をクローズし、 処理は終了する。
1 d) 圧縮ファイル合成処理:
図 8は、 ファイル ffi^制御部 1 1内の IBtフアイノレ合成処理部 2 6、 即ち、 C P U 1が行う圧縮ファイル合成処理を説明するフローチヤ一トである。
図 8中、 ステップ S 9 1は、 圧縮ファイル 1 3をオープンする。 ステップ S 9 2は、 圧縮ファイルの先頭識別用のヘッダのデータを編集する。 ステップ S 9 3 は、 補助記憶装置 3のデータファイル 1 5内の圧縮バラメータの退避ファイルを オープンし、 ステップ S 9 4は、 IBtパラメ一夕の退避ファイルの圧縮バラメ一 タを JBtファイル 1 3に複写する。 ステップ S 9 5は、 IBSパラメータの退避 ファイルをクローズする。
ステップ S 9 6は、 補助記憶装置 3のデータファイル 1 5内のアドレス 1f¾の 退避ファイルをオーブンし、 ステップ S 9 7は、 アドレス情報の退避ファイルの アドレス情報を圧縮ファイル 1 3に複写する。 ステップ S 9 8は、 アドレス Iflfi の退避ファイルをクローズする。 更に、 ステップ S 9 9は、 補助記憶装置 3の データファイル 1 5内の圧縮データの退避ファイルをオーブンし、 ステップ S 1 0 0は、 圧縮データの退避ファイルの圧縮デ一夕を圧縮ファイル 1 3に複写する。 ステップ S 1 0 1は、 圧縮データの退避ファイルをクローズする。 ステップ S 1 0 2は、 圧縮ファイルの末尾識別用のトレ一ラのデータを編集し、 ステップ S 1 0 3は、 圧縮ファイル 1 3を CD— R OM 6 aに格納する。 又、 ステップ S 1 0 4は、 I iファイル 1 3をクローズし、 処理は終了する。
図 9は、 上記の如き 1 a ) 領域分割処理及び出現頻度演算処理、 1 b) 圧縮パ ラメ一夕演算処理、 1 c ) データ圧縮処理及びアドレス情報演算処理及び 1 d) 圧縮ファィル合成処理による圧縮ファィルの合成を説明する図である。 同図中、
(a) は圧縮ハ'ラメ一夕を示し、 本実施例ではハフマン による圧縮を行うた めの ffiftlパラメータである。 同図中、 (b) は辞書ファイルの区間を示し、 本実 施例では各区間が例えば 2 k b y t eであり、 各区間は辞書データ及びィンデッ クスデータからなる。例えは 辞典の場合、 辞書デ一夕には、 語の意味を説明 するテキストのテキストデ一夕、 例えば語が動物であればその動物を示す画像 データ、 例えば語が鳥であればその鳥の鳴き声を示す音声デー夕等が含まれる。 ィンデックスは、 辞書ファイルから所望の辞書データを検索するために使用され るもので、 辞書データに対して設けられており、 キーワードと呼ばれることもあ る。 インデックスデータには、 見出しのポインタや項目のポインタ等が含まれる。 見出しのデ一夕には、 見出し語が含まれる。 又、 項目のデータには、 見出し語や 解説文等が含まれる。
図 9中、 (c ) は データを示し、 各区間が可変長で IBSされている忧態を 示す。又、 同図中、 (d) は各区間に対して演算されたアドレス If!!を示し、 ( e ) は ffi^、'ラメ一夕と、 ァドレス龍と、 圧縮デ一夕を合成して管理情報を 先頭に付加することで得られる圧縮ファイルを示す。 管理† Sは、 辞書ファイル 名、 辞書フアイルの種別、 辞書フアイルの圧縮種別等の、 圧縮フアイルを検索す る際に使用される情報が含まれる。 更に、 同図中、 ( f ) はヘッダ及びトレーラ を付加された圧縮ファィルを示す。
図 1 0は、 圧縮ファイル内の圧縮データの形式を説明する図である。 同図中、 (a) は圧縮パラメ一タを示し、 本実施例ではハフマン符号による圧縮を行うた めの圧縮パラメ—夕である。又、 同図中、 (b) は圧縮データを示し、 各区間が 可変長で圧縮されている状態を示す。 各区間は、 同図中、 (c ) に示すように、 制御情報と、 データと、 E O Bとからなる。 制御情報は、 同図(d) に示す ように、 E OB肖 IJ除フラグ、 非圧縮フラグ、 圧縮パラメ一夕種別等からなる。 各区間の終わりを示す E O Bは、 例えば 1 8ビット〜 2 4ビットである。 しか し、 各区間を固定長にした場合には、 ^区間以外では E O Bを Η各することが できる。 そこで、 デ一夕圧縮率を更に向上するために、 E O B削除フラグが設け られ、 EO Bが削除されているか否かを示す。 /JP99/04387 又、 出現頻度の低い語が多い特異な区間では、 圧縮データの方が非 データ より長くなつてしまう が発生する。 そこで、 このような場合のデータ ΙΒϋ率 を更に向上するために、 上記の如く圧縮デ一夕に代わつて非圧縮デー夕が圧縮 ファイルに格納される。非 ffi隨フラグは、 このように IBSデータに代わって非圧 縮データが格納されているか否かを示す。
圧縮パラメータ (又は、 圧縮パラメータ識別番号) は、 該当する区間の圧 縮に用いられている、 例えば 1〜!!までの nS^の I Sパラメータのうちの 1つ を示す。 これにより、 各区間の圧縮に用いられている圧縮パラメ一タを、 各区間 の先頭に設けられている制御情報から知ることができる。
図 1 1は、 データ処理装置の第 1実施例にぉレ、て構成されるフアイル検索 ·表 示システムを示す機能ブロック図である。 同図中、 図 1と同 分には同一^ を付し、 その説明は御各する。
図 1 1に示すファィノレ検索 ·表示システムは、 大 B各検索 ·表示制御部 3 1と、 圧縮ファイル 1 3と、 入力部 3 3と、 検索結果表示部 3 5とからなる。 '表 示制御部 3 1は、 図 1に示す C P U 1により構成さ 入力処理部 4 1、 検^ « 御部 4 2、 リード処理部 4 3 , 4 4、 伸長処理部 4 5及び表示処理部 4 6からな る。 Ei缩ファイル 1 3は、 例えば図 1に示す C D— R OM 6 aにより構成される。 入力部 3 3は、 図 1に示す入力装置 4により構成される。 又、 検索結果表示部 3 5は、 図 1に示す表示装置 5により構成される。
各処理の内容と制御シーケンスは、 入力部 3 3から入力された検索モード、 キーワード等に基づいて、 入力処理部 4 1及び検^^御部 4 2により決定される。 入力部 3 3から入力されたィンデックスデータに対応するィンデックスボインタ は、 リード処理部 4 3により圧縮ファイル 1 3から読み出されて、 インデックス ポインタのデータは伸長処理部 4 5により伸長される。 該当する本文のテキスト データは、 獲得されたインデックスポインタの値に基づいてリード処理部 4 4に より読み出さ 本文のテキストデータは伸長処理部 4 5により伸長される。上 記の如き ~¾の検索処理により得られる検索結果は、 表示処理部 4 6により検索 結果表示部 3 5上に表示される。
次に、 C D— R OM入出力装置 6にロードされた C D— R〇M 6 aに格納され た圧縮フアイル 1 3を読み取って所望のデ一夕を検索 ·表示するフアイノレ検索 · 表示処理について説明する。 ファイル検索'表示処理は、 : 各インデックスリー ド処理と、 テキストリード処理とからなり、 データ伸長処理を呼び出して実行さ れる。 本実施例では、 説明の便 lh、 CD -R OM 6 aには C PU 1にファイル '表示処理を行わせるプログラムが格納されており、 C PU 1は周知の方法 でこのプログラム及び圧縮フアイルを C D— R OM 6 aから読み取って補助記憶 装置 3にロードするものとする。
2 a ) インデックスリード処理:
図 1 2は、 検索'表示処理部 3 1のリード処理部 4 3及び伸長処理部 4 5、 即 ち、 図 1に示す C PU 1が行うインデックスリード処理を説明するフローチヤ一 トである。 同図中、 ステップ S 1 1 1は、 ユーザが入力部 3 3より入力したイン デックスデータに基づいて、 最上位インデックスのアドレス情報を設定する。 ス テツプ S I 1 2は、 データ伸長処理をコールし、 補助記憶装置 3内のフアイノレ検 索処理を行わせるプログラムからデータ伸長処理を行わせるル一チンを読み出す ことで、 圧縮ファイル 1 3内の ¾±位インデックスのアドレスを伸長する。 ス テツプ S I 1 3は、 上記インデックスデータに基づき、 最上位インデックスの頭 文字である上位インデックスのアドレスを獲得する。 ステップ S I 1 4は、 デ一 夕伸長処理をコールし、 圧縮ファイル 1 3内の上位インデックスのアドレスを伸 長する。 ステップ S 1 1 5は、 上記インデックスデ一夕に基づき、 次階層の下位 インデックスのアドレスを獲得する。 ステップ S 1 1 6は、 デ一夕伸長処理を コールし、 圧縮ファイル 1 3内の上記次階層の下位インデックスのアドレスを伸 長する。 ステップ S I 1 7は、 最下位インデックスのアドレスの伸長が終了した か否かを判定し、 判 果が NOであれば、 処理はステップ S 1 1 5へ戻る。 他 方、 ステップ S I 1 7の判定結果が YE Sの場合、 処理は終了する。
2 b) データ伸長処理:
図 1 3は、 検索'表示制御部 3 1の伸長処理部 4 5、 即ち、 図 1に示す C P U 1が行うデータ伸長処理を説明するフローチヤ一トである。 データ伸長処理は、 ィンデックスリ一ド処理及びテキストリード処理により呼び出される。
図 1 3中、 ステップ S 1 2 1は、 ユーザが入力部 3 3より入力したインデック スデータに基づいて、要求された伸長アドレス、 データサイズや記憶領域を補助 記憶装置 3に記憶して、伸長されたデ一夕サイズに対して充分な大きさの記憶領 域を補助記憶装置 3内に用 *る。 ステップ S 1 2 2は、 C D— R OM 6 aから 読み取って補助記憶装置 3に口一ドされた圧縮ファイル 1 3がオーブンされてい るか否かを判定し、 判定結果が NOであると、 ステップ S 1 2 3は補助記憶装置 3内の圧縮ファイル 1 3をオーブンする。 ステップ S 1 2 4は、 ヘッダとトレ一 ラがセットされているか否かを判定し、 判定結果が NOであると周知のエラ一処 理に移行する。
他方、 ステップ S 1 2 4の判定結果が YE Sであると、 ステップ S 1 2 5は、 圧縮ファイル 1 3から Efitパラメ一夕を読み取り、 圧縮パラメ一夕内の 8ビット コ一ドの出現頻度及び 1 6ビットコ一ドとその出現頻度を読み込む。 ステップ S 1 2 6は、 8ビットコードの出現頻度及び 1 6ビットコードの出現頻度に基づき、 複数の圧縮パラメ一夕の各々に該当するハフマン木を作成し、 処理は後述するス テツブ S 1 2 7へ進む。 尚、 ハフマン木の葉のデータには、 8ビットコードか 1 6ビットコ一ドかの判定用フラグが付加されている。
ステップ S 1 2 2の判定結果が YE S又はステップ S 1 2 6の後、 ステップ S 1 2 7は要求された伸長アドレスに対応するアドレス情報を IBSファイル 1 3か ら読み込む。 ステップ S 1 2 8は、 アドレス情報に基づいて、 EEiiファイル 1 3 から対応する BB ^データの区間を読み込む。 ステップ S 1 2 9は、 制御情報内の 非圧縮フラグがセットされてオンであるか否かを判定する。 ステップ S 1 2 9の 判定結果が YE Sであると処理は後述するステップ S 1 3 2へ進み、 判定結果が NOであると処理はステップ S 1 3 0へ進む。
ステップ S 1 3 0は、 制御情報内の圧縮パラメ一夕種別に対応するハフマン木 により圧縮デ一夕の区間を伸長し、 ステップ S 1 3 1は、 8ビットコードか 1 6 ビットコ一ドかの判定用フラグに基づいて、 伸長されたデータを上記記憶領域に 複写し、 処理はステップ S 1 3 3へ進む。 この場合、 区間が 区間であれば、 区間の終わりに E 0 Bが ftSnされてレ、るので E 0 Bまでの可変長の区間のデー夕 を伸長して複写し、 区間が最終区間以外の途中区間であれば、 制御情報に E O B が削除されていることを示す E O B削除フラグが含まれているので 2 k b y t e の固定長の区間のデー夕を伸長して複写する。
他方、 ステップ S 1 3 2は、 8ビットコードか 1 6ビットコードかの判定用フ ラグに基づいて、 非圧縮データを上記記憶領域に複写し、 処理はステップ S 1 3 3へ進む。 この場合、 区間が最終区間であれば、 区間の終わりに E O Bが付加さ れているので E O Bまでの可変長の区間の非圧縮データをそのまま複写し、 区間 が最終区間以外の途中区間であれば、 制御情報に E◦ Bが削除されていることを 示す E O B削除フラグが含まれているので 2 k b y t eの固定長の区間の非圧縮 データをそのまま複写する。
ステップ S 1 3 3は、 区間のアドレス情報を更新し、 ステップ S 1 3 4は、 圧 縮ファイル 1 3に対して要求されたデ一夕サイズの伸長が完了したか否かを判定 する。 ステップ S 1 3 4の判定結果が NOの場合、 ステップ S 1 2 7は、 次の区 間の伸長アドレスに対応したアドレス情報を IBSファイル 1 3から読み込む。 ス テツプ S 1 2 8は、 この次の区間の伸長ァドレスに対応したァドレス情報に基づ いて、 圧縮ファイル 1 3から対応する圧縮データの区間を読み込み、 処理はス テツプ S 1 2 9へ進む。 他方、 ステップ S 1 3 4の判定結果が YE Sであると、 処理は終了する。
2 c ) テキストリード処理:
図 1 4は、 検索'表示制御部 3 1のリード処理部 4 4及び伸長処理部 4 5、 即 ち、 図 1に示す C P U 1が行うテキストリ一ド処理を説明するフローチャートで ある。
図 1 4中、 ステップ S 1 4 1は、 ユーザが入力部 3 3より入力したインデック スデータに基づいて、 伸長されたデータ中、 インデックスと一 ¾fる項目をカウ ントする。 ステップ S 1 4 2は、 入力されたインデックスデータに基づいて、 ィ ンデッタスの項目ポインタの値をアドレスに設定する。 ステップ S 1 4 3は、 デ一夕伸長処理をコールし、 補助記憶装置 3内のフアイノレ検索処理を行わせるブ ログラムからデータ伸長処理を行わせるルーチンを読み出すことで、 圧縮フアイ ル 1 3内の項目ポインタで示されるテキスト、 即ち、 辞書デ一夕を 1区間分伸長 する。
ステップ S 1 4 4は、 項目ポインタで示される辞書デ一夕が終了したか否かを 判定し、 判^果が NOであると、 ステップ S 1 4 5は次の 1区間のアドレスを 設定する。 又、 ステップ S 1 4 6は、 デ一夕伸長処理をコールして、 圧縮フアイ ル 1 3内の項目ポインタで示される辞書データをこの次の 1区間分伸長し、 処理 はステップ S 1 4 4へ戻る。 他方、 ステップ S 1 4 4の判定結果が Y E Sの場合、 ステップ S 1 4 7は入力されたインデックスデータに基づいて、 全ての項目につ レ、ての処理が終了したか否かを判定し、 判定結果が NOであると、 処理はステツ ブ S 1 4 2へ戻る。 ステップ S 1 4 7の判定結果が Y E Sであると、 ステップ S 1 4 8は全ての項目にっレ、て伸長された辞書データを検索結果表示部 3 5に表示 し、 処理は終了する。
尚、 ステップ S 1 4 8は、 ステップ S 1 4 7の前に行うようにしても良い。 こ の場合、 ステップ S 1 4 8は、 各項目について伸長された辞書データをその都度 検索結果表示部 3 5に表示する。
上記実施例では、 説明の MLb、 区間が可変長であるものとした。 区間が可変 長であると、 データ伸長速度を向上することができる。 これは、 デ一夕の や 区分に対応して適切な長さの区間を設定することができ、 余分なデ一夕を伸長す る必要がないことによる。
他方、 区間が固定長であると、 データ IB効率が良く、 又、 区間の Ε»ίのァ ドレス情報を圧縮ファィルに格納しておかなくてもァドレス情報を ffifilフア ル から復元可能である。 これは、 区間が固定長であり、 各区間には区間番号が付加 されているため、 各区間の他の区間に対する相対位置が算出可能であることによ る。
尚、 区間を可変長とした場合には、 区間の圧 のアドレス IffSを圧縮フアイ ルに格納しておく i¾がある。従って、 区間を固定長とするか、 可変長とするか は、 デ一夕圧縮率を するか、 データ伸長速度を舰するかにより決定すれば 良い。
又、 C D— R OM 6 aに格納される辞書ファイルは 1以上であっても良レ、。複 数の辞書や百科辞典等に関する複数の辞書フアイルを C D— R OM 6 aに格納し た場合でも、 図 9中、 (e ) に示す管理情報内の辞書フアイノレ名や辞書ファイル の種別から検索した 、辞書ファィルを特定することができる。 上記実施例では、 デ―タ I Sにハフマン を用いたが、 ュニバーサル 等 も使用でき、 辞書データを各区間毎に共通な圧縮パラメータで効率良く圧縮でき るデータ圧 ¾t ^であれば、 ハフマン^に限定されるものではなレヽ。又、 デー 夕圧縮及び伸長の となるデータは、 辞書デ一夕に限定されず、 インデックス とデータとからなるデータベースのデータをも包含する。
又、 上記実施例では、 ファイル検索処理プログラムおよび ファイルを補助 記憶装置 3にコピーして検索処理を行う説明しているが、 これらを補助記憶装置 3にコピーせず、 プログラムと ffiiSファイルを主記憶装置 2に展開し、 前述と同 様の処理を行うようにしても良い。
尚、 上記実施例で用いる圧縮アルゴリズムによって、 通常の 8ビットでのハフ マン によるデータ圧縮処理により圧縮率が向上し、 C D - R OMや補助記憶 装置として説明したハードディスクなどの記憶媒体に される田缩ファィルの 領域は少なくなる。圧縮アルゴリズムによって圧縮率は向上するが、 IBSフアイ ルを伸長するための処理時間は通常のハフマン符号圧縮のときとほとんど変わら ない。
検索処理にかかる時間は、 読み取り装置(ドライブ) のシーク時間と ffiftlファ ィルのリ一ド時間と伸長処理時間からなる。
のように、 圧縮アルゴリズムにより圧縮率が向上したことにより、 記 tl^ 体に される圧縮ファイルの言 £ ^領域が少なくなることから、 検索プログラム の検索処理にかかる時間のシーク時間が し、 その結果、 検索速度が向上する。 この効果はハ一ドウエアの性能向上に伴い、 さらに顕著になる。
次に、 本発明になるフアイル処理方法及びデータ処理装置の第 2実施例を説明 する。 ファイル処 法及びデータ処理装置の第 2実施例は、 本発明になる記憶 媒体の第 2実施例を用いる。 尚、 記憶媒体の第 2実施例では、 本発明が CD -R OMに適用されているが、 記憶媒体自体は CD— R OIV [に限定されず、 本発明は C D— R OM以外の光学的情報記憶媒体、 光磁気ディスク等の光磁気記憶媒 {^ フロッピ一ディスク等の磁気記憶媒体、 各種半導体メモリデバイス等にも同様に 適用可能であることは言うまでもない。
フアイル処理方法の第 2実施例を採用したコンピュータシステムの 各構成は、 図 1に示すプロック図と同様であり、 データ処理装置の第 2実施例に対応する。 データ処理装置の第 2実施例では、 検索 ·表示制御部が、 図 1 5に示す如き構成 を有する。 図 1 5中、 図 1 1と同 ~¾分には同一 を付し、 その説明は省略す 。
図 1 5において、 検索'表示制御部は、 大略 C D— R OMアプリケーション 5 1、 オペレーティングシステム (O S) 5 2、 ランダムファイルマネージャ (F M) 5 3、 シリアルファイルマネージャ (FM) 5 4、 C D— R 0M 6 a用ドラ ィバソフトウエア (DV) 5 5、 補助記憶装置 3を構成するハードディスク 3 a 用のドライバソフトウェア (DV) 5 6 , 5 7及び表示装置 5用ドライバソフト ウェア (DV) 5 8からなる。
C D— R OMアプリケーション 5 1は、 アプリケーション制御部 6 1、 入力処 理部 6 2、 リード処理部 6 3及び表示処理部 6 4からなる。 又、 DV 5 5には、 図 1 1に示すリード処理部 4 3 , 4 4及び伸長処理部 4 5に対応するリード'伸 長処理部 7 1が組み込まれている。 アプリケーション制御部 6 1は、 図 1 1に示 す検^ fj御部 4 2に対応し、 各処理の内容と制御シーケンスを決定する。入力処 理部 6 2は、 図 1 1に示す入力処理部 4 1に対応し、 動作モードの入力や対象 ファイルの選択を行う。 リード処理部 6 3及び DV 5 5に組み込まれているリー ド.伸長処理部 7 1は、該当する圧縮データを圧縮ファイル 1 3から読み出して 伸長する。伸長されたデ一夕に基づいて種々の処理が行われ、 表示処理部 6 4に より検索結果が検索結果表示部 3 5上に表示される。表示処理部 6 4は、 図 1 1 に示す表示処理部 4 6に対応する。本実施例では、 圧縮ファイル 1 3に格納され ているデータは、 第 1実施例のような辞書、 辞典等のインデックスと実デ一 夕からなるものに限定されず、 いかなるデータであっても良い。 又、 データ処理 装置はファィル制御装置を構成する。
C D— R OMアプリケーション 5 1は、 予め補助記憶装置 3にインストールさ れていても、 C D— R〇M 6 a等から読んで補助記憶装置 3にインストールして も良い。又、 DV 5 5は、 DV 5 6〜5 8と同様に、 予め補助記憶装置 3にイン ストールされていても、 C D— R OM 6 a等から読んで補助記憶装置 3にインス トールしても良い。 尚、 説明の Mlh、 O S 5 2及び FM 5 3 , 5 4は、 予め補 助 ΐ己憶装置 3にインスト一ルされているものとする。
従って、 記憶媒体の第 2実施例は、 圧縮ファイル 1 3及び DV 5 5のうち少な くとも一方を格納しており、 C D— R OMアプリケーション 5 1を更に格納して いても良い。
このように、 本実施例では、 D V 5 5に伸長ライブラリ (リード,伸長処理部 7 1 ) を組み込むことにより、 アプリケーションソフトウェアを各 ファイル に合わせて構成する必要がなく、 DV 5 5のみの変更により既存のアプリケー シヨンソフトゥェァを用レ、ても圧縮ファィルのリード'伸長処理が可能となる。 図 1 6は、 C D— R OMアプリケーション 5 1のリード処理部 6 3が DV 5 5 のリード ·伸長処理部 7 1と共に行うリ一ド処理、 即ち、 図 1に示す C P U 1の リ―ド処理を説明するフローチャートである。
図 1 6において、 ステップ S 1 5 1は、 C P U 1内のリードバッファを初期化 する。 ステップ S 1 5 2は、 圧縮ファイル 1 3のリ一ドアドレス (論理ァドレ ス) をセットする。 ステップ S 1 5 3は、 区間のリード長をセットする。又、 ス テツブ S 1 5 4は、 リード'伸長処理をコールし、 処理は終了する。
図 1 7は、 DV 5 5のリード'伸長処理部 7 1が行うリード'伸長処理、 即ち、 図 1に示す C P U 1のリード'伸長処理を説明するフローチャートである。
図 1 7において、 ステップ S 1 6 1は、 ユーザが入力部 3 3より入力したイン デックスデータに基づいて、 要求された伸長アドレス、 データサイズや記憶領域 を補助記憶装置 3に記憶して、 伸長されたデータサイズに対して充分な大きさの 記憶領域を補助記憶装置 3内に用意する。 ステップ S 1 6 2は、 C D— R OM 6 aから読み取つて補助記憶装置 3にロードされた圧縮ファイル 1 3がオープンさ れているか否かを判定し、 判^果が NOであると、 ステップ S 1 6 3は補助記 憶装置 3内の圧縮ファイル 1 3をオープンする。 ステップ S 1 6 4は、 ヘッダと トレーラがセットされているか否かを判定し、 判定結果が NOであると周知の一 般ファイルの処理に移行する。
他方、 ステップ S 1 6 4の判定結果が YE Sであると、 ステップ S 1 6 5は、 圧縮ファイル 1 3から圧縮パラメ一夕を読み取り、 圧縮パラメータ内の 8ビット コードの出現頻度及び 1 6ビットコードとその出現頻度を読み込む。 ステップ S 1 6 6は、 8ビットコードの出現頻度及び 1 6ビットコ一ドの出現頻度に基づき、 複数の圧縮パラメータの各々に該当するハフマン木を作成し、 処理は後述するス テツブ S 1 2 7へ進む。 尚、 ノ、フマン木の葉のデータには、 8ビットコ一ドか 1 6ビットコ一ドかの判定用フラグが付加されている。
ステップ S 1 6 2の判定結果が YE S又はステップ S 1 6 6の後、 ステップ S 1 6 7は要求された伸長アドレスに対応するアドレス情報を EK ファイル 1 3か ら読み込む。 ステップ S 1 6 8は、 アドレス情報に基づいて、 I Sファイル 1 3 . から対応する圧縮データの区間を読み込む。 ステップ S 1 6 9は、 制御情報内の 非圧縮フラグがセットされてオンであるか否かを判定する。 ステップ S 1 6 9の 判定結果が YE Sであると処理は後述するステップ S 1 7 2へ進み、 判^果が NOであると処理はステップ S 1 7 0へ進む。
ステップ S 1 7 0は、 制御情報内の圧縮パラメ一夕種別に対応するハフマン木 により圧縮デ一夕の区間を伸長し、 ステップ S 1 7 1は、 8ビットコ一ドか 1 6 ビットコードかの判定用フラグに基づいて、 伸長されたデータを上言己言己憶領域に 複写し、 処理はステップ S 1 7 3へ進む。 この場合、 区間が最終区間であれば、 区間の終わりに E 0 Bが付加されているので E 0 Bまでの可変長の区間のデータ を伸長して複写し、 区間が最終区間以外の途中区間であれば、 制御情報に E O B が削除されていることを示す E O B削除フラグが含まれているので 2 k b y t e の固定長の区間のデー夕を伸長して複写する。
他方、 ステップ S 1 7 2は、 8ビットコ一ドか 1 6ビットコードかの判定用フ ラグに基づいて、 非 IB¾データを上記記憶領域に複写し、 処理はステップ S 1 7 3へ進む。 この場合、 区間が最終区間であれば、 区間の終わりに E O Bが iiSUさ れているので E 0 Bまでの可変長の区間の非圧縮データをそのまま複写し、 区間 が最終区間以外の途中区間であれば、 制御情報に E 0 Bが削除されていることを 示す E O B削除フラグが含まれているので 2 k b y t eの固定長の区間の非圧縮 デ一夕をそのまま複写する。
ステップ S 1 7 3は、 区間のァドレス情報を更新し、 ステップ S 1 7 4は、 圧 縮ファイル 1 3に対して要求されたデー夕サイズの伸長が完了したか否かを判定 する。 ステップ S 1 7 4の判定結果が NOの場合、 ステップ S 1 6 7は、 次の区 間の伸長アドレスに対応したアドレス情報を圧縮ファイル 1 3から読み込む。 ス テツプ S 1 6 8は、 この次の区間の伸長アドレスに対応したアドレス情報に基づ いて、 圧縮ファイル 1 3から対応する圧縮データの区間を読み込み、 処理はス テツプ S 1 6 9へ進む。他方、 ステップ S 1 7 4の判定結果が Y E Sであると、 処理は終了する。
第 2実施例では、 アプリケーションとして C D— R OM 6 aを使用する C D— R OMアプリケーション 5 1を例示したが、 これに限定されるものではなく、 ファイルを扱う 、かなるアプリケーションでも本発明が適用されたドライノ ソフ トゥエアを利用することが可能である。
又、 本発明のリード'伸長処理部 7 1を C D— R OM用ドライバソフトウェア に組み込んだ例を示したが、 他の記憶装置に対応するドライバソフトウェア ( ハードディスクドライブ用ドライノくソフトウェア、 図示しないフロッピイデイス クドライブ用ドライバソフトウェア等) にリード'伸長処理部 7 1を組み込むこ とで同様の処理か可能であり、 同様の効果を得ることができる。
以上、 本発明を実施例により説明したが、 本発明は本発明の範囲内で種々の変 形及び改良が可能であることは言うまでもない。

Claims

請求の範囲
1 . ファイルを複数の区間に分割して複数の圧縮パラメータを用いてフアイ ルの各区間を圧縮する圧縮ステップと、
圧縮されたフアイルを記憶媒体に格納する格納ステッブとを含む、 ファイル処 理方法。
2. B E縮ステッブは、 risファィル内の語毎の出 の分布に基づ ヽ た複数の圧縮パラメータを用いる、 請求の範囲第 1項 iaaのフアイゾレ処 法。
3. ίίΐ£Ε縮ステップは、 圧縮デ一夕の方が非圧縮データより情報量が多く なる区間のデ一夕に対しては、 非圧縮デー夕のままとして非 IBtデ一夕を示すフ ラグを該当区間の制御情報に含める、 請求の範囲第 1項 ia¾のフアイノレ処 法。
4. 編 2JE縮ステップは、 各区間の制御情報に圧縮パラメ一夕の を 含める、 請求の範囲第 1項記載のファィル処理方法。
5. UEE縮ステップは、 H 区間の終わりを示す終了情報を各区間の末尾 に ίί¾Πすると共に、 前記区間が固定長の場合は最終区間のみに前 ^了 1 ^を付 加して前記最終区間以外の区間では終了情報を削除したことを示すフラグを該当 区間の制御籠に含める、 請求の範囲第 1項記載のファィノレ処理方法。
6. コンピュータのアプリケーションソフトウェアとは したドライノ、 *ソ フトウェアにより前記記憶媒体から読み出された圧縮ファィルを伸長するステッ プを更に含む、 請求の範囲第 1項記載のファィル処理方法。
7. フアイルを複数の区間に分割して複数の IBtパラメータを用いてフアイ ルの各区間を圧縮する圧縮処理部と、
IBtされたファイルを記憶媒体に格納する格納処理部とを備えた、 データ処理
8. i E縮処理部は、 編己ファィル内の語毎の出現繊の分布に基づレ、た 複数の圧縮パラメ一夕を用いる、 請求の範囲第 7項言 ei¾のデータ処理装 ϋο
9. r¾E縮処理部は、 圧縮デ一夕の方が非圧縮デ一夕より情報量が多くな る区間のデー夕に対しては、 非圧縮デー夕のままとして非 Ι ϋデ一夕を示すフラ グを該当区間の制御情報に含める、 請求の範囲第 7項記載のデータ処理装 jto
1 0. 編 fiffi縮処理部は、 各区間の制御情報に圧縮パラメ一夕の識別情報を 含める、 請求の範囲第 7項言 のデータ処理装
1 1 . 縮処理部は、 謂己区間の終わりを示す終了情報を各区間の末尾 に付加すると共に、 謂己区間が固定長の場合は最終区間のみに鶴 了情報を付 加して tn己最終区間以外の区間では終了情報を削除したことを示すフラグを該当 区間の制御情報に含める、 請求の範囲第 7項 のデータ処理装置。
1 2. コンピュータのアプリケーションソフトウェアとは したドライノヽ * ソフトウェアにより前記記憶媒体から読み出された IBiファィルを伸長する伸長 処理部を更に備えた、請求の範囲第 7項記載のデー夕処理装置。
1 3. コンピュータで読み取り可能な情報を格納した記 体であって、 コンピュータに、 フアイルを複数の区間に分割して複数の圧縮ノ、'ラメ一夕を用 いてファイルの各区間を圧縮させる圧縮処理手段と、
コンピュー夕に、 ESIされたファイルを記憶手段に格納させる格納処理手段と を備えたプログラムを格納した、記憶媒体。
1 4. SIBS処理手段は、 コンピュータに、 1ϊϊ£ファイル内の語毎の出現 雖の分布に基づいた複数の I iパラメ一夕を用いさせる、 請求の範囲第 1 3項 mの記憶媒体。
1 5. ΙίίΙΞΕ縮処理手段は、 コンピュータに、 圧縮データの方が非 Ι Ι&デ一 夕より情 mが多くなる区間のデー夕に対しては、 非圧縮デー夕のままとして非 圧縮データを示すフラグを該当区間の制御情報に含めさせる、 請求の範囲第 1 3 項記載の記憶媒 ί*ο
1 6. Ιίί Ε縮処理手段は、 コンピュータに、 各区間の制御情報に圧縮パラ メータの識別情報を含めさせる、 請求の範囲第 1 3項記載の記憶媒
1 7. 窗 EE縮処理手段は、 コンピュータに、 ¾区間の終わりを示す終了 情報を各区間の末尾に ί¾Πさせると共に、 ΙΐίΙ己区間が固定長の場合は最終区間の みに前言 ^了情報を (¾1して前記最終区間以外の区間では終了情報を削除したこ とを示すフラグを該当区間の制御情報に含めさせる、 請求の範囲第 1 3項記載の 記憶媒体。
1 8. ΙίίΙ2プログラムは、 コンピュータに、 コンピュータのアプリケ一ショ ンソフトウエアとは¾¾したドライノ Jフトウエアにより爾己記憶手段から読み 出された圧縮ファイルを伸長させる伸長処理手段を更に備えた、 請求の範囲第 1 3項記載の記憶媒
1 9. コンピュータで読み取り可能な情報を格納した記憶媒体であって、 複数の区間に分割されたファイルが、 複数の圧縮パラメータを用いて各区間が 圧縮されて記憶された領域と、
itneEE縮バラメータが記憶された領域とを有する、 記憶媒
2 0. iEEBパラメ一夕は、 ίίΕファイル内の語毎の出^ ¾の分布に基 づいている、 請求の範囲第 1 9項記載の記憶媒体。
2 1 . IBSデータの方が非圧縮データより情報量が多くなる区間のデータに 対しては、 非 データのままとして非 ffi ^データを示すフラグが該当区間の制 御情報に含められている、 請求の範囲第 1 9項 ia¾の記憶媒
2 2. 各区間の制御體は、 EfiSパラメータの識別情報を含む、 請求の範囲 第 1 9項言 の記讓
2 3. 編己区間の終わりを示す終了情報が各区間の末尾に ίίίΙΙされると共に、 r¾区間が固定長の場合は最終区間のみに前言 冬了情報が付加されて前 Efts^区 間以外の区間では終了情報を削除したことを示すフラグが該当区間の制御 に 含められている、 請求の範囲第 1 9項記載の記憶媒体。
2 4. コンピュータのアプリケーションソフトウエアとは したドライバ ソフトウエアが更に格納されており、
Ιΐί ドライバソフトウェアは、 コンピュータに、 記憶媒体から読み出された圧 縮フアイルを伸長させる伸長処理手段を備えたプログラムを含む、 請求の範囲第
1 9項言 の記憶媒
2 5. 複数の パラメ一夕と、 I ^数の IBSパラメータにより原ファイル か 数の区間に分割され該区間毎に圧縮された複数の区間データとから構成され る圧縮ファィルが記録された記録媒体にァクセスする読み出しステップと、 該読み出しステップにより 媒体から読み出される区間デ一夕を、 該区間 データに対応する圧縮パラメータにより伸長する伸長ステップとを含む、 フアイ ル処理方法。
2 6. 複数の圧縮パラメータは、 ίΓ Ι^ファイル内の語毎の出現繊の 分布に基づき作成されている、 請求の範囲第 2 5項 のファイル処理方法。
2 7. ΙίίΕΕΕϋファィルは、 非 の区間デ一夕と該区間が非圧縮であるこ とを示す非圧縮フラグを更に含み、 前記伸長ステップは、 前^み出しステップ により ^媒体から読み出される区間データが非圧縮を示すとき該区間デー 夕の伸長を抑止する、請求の範囲第 2 5項 El¾のファイル処 法。
2 8. H2各区間の制御情報に Iti i Sパラメ一夕の l^iJif gを含む、 請求 の範囲第 2 5項 のファィル処理方法。
2 9 , 前記各区間の制御情報に区間の終わりを示す終了情報が区間データに ロされていないことを示す削除フラグを含み、 na^み出しステップは、 該削 除フラグに基づき最終区間を判断して区間デー夕の読み出しを行う、 請求の範囲 第 2 5項 12¾のファイル処 法。
3 0. 謂己伸長ステップは、 Hii己^媒体へアクセスするための 媒体 用のドライバソフトウェアにより実行される、 請求の範囲第 2 5項言£¾のフアイ ル処理方法。
3 1. itneie^媒体用のドライバソフトウェアは、 コンピュータのアブリ ケ一シヨンソフトウェアとは¾¾している、 請求の範囲第 3 0項言 e¾のファイル 処理方法。
3 2. 複数の圧縮パラメータと、 謎数の圧縮パラメータにより原ファイル が複数の区間に分割され該区間毎に ΕΕϋされた複数の区間データとから構成され る圧縮ファィルが された 媒体へのァクセスを制御するリ一ド処理部と、 該リード処理部により^^媒体から読み出される区間データを、 該区間デ一 夕に対応する パラメ一夕により伸長する伸長処理部とを備えた、 データ処理 装
3 3. i 複数の I tパラメ一夕は、 ΙίίΕϋファイル内の語毎の出現赚の 分布に基づき作成されている、 請求の範囲第 3 2項 ¾ のデータ処理装 go
3 4. flSBE縮ファィルは、 非圧縮の区間デ一夕と該区間が非 IBTCあるこ とを示す非 IBitフラグを更に含み、 IHIB伸長処理部は、 ίίΕリード処理部により 前記記録媒体から読み出される区間データが非圧縮を示すとき該区間データの伸 長を抑止する、 請求の範囲第 3 2項記載のデータ処理装 go
3 5. ΙίίΕ各区間の制御情報に ΙίίϊΒΕ^ハ'ラメータの翻 IJ を含む、 請求 の範囲第 3 2項 ΙΕΙ¾のデータ処理装 Ho
3 6. tflfi各区間の制御情報に区間の終わりを示す終了情報が区間デー夕に ίί¾Πされていないことを示す削除フラグを含み、 リ一ド処理部は、 該削除フ ラグに基づき 区間を判断して区間データの読み出しを制御する、請求の範囲 第 3 2項^のデータ処3¾^0
3 7, ίίΐε伸長処理部は、 ΙΐίΕΕϋ媒体へアクセスするための ¾1 ^媒体用 のドライバソフトウェアにより実行される、 請求の範囲第 3 2項 のデータ処 理装置。
3 8. ΪΕΪ2 媒体用のドライバソフトウエアは、 データ処理装置のアプリ ケーシヨンソフトウェアとは^している、 請求の範囲第 3 7項 iemのデータ処 理装 So
3 9. アプリケーションソフトウェアからの読み出し要求に応じて、 複数の ^パラメータと、 数の! Biパラメータにより原ファイルか 数の区間に分 割され該区間毎に i Sされた複数の区間データとから構成される EEitファイルが された 媒体へのアクセスを制御するリ一ド処理部と、
該リード処理部により^^媒体から読み出される区間データを、該区間デー 夕に対応する IBiパラメ一夕により伸長し、 該アプリケーションソフトウエアに 供給する伸長処理部とを備えた、 データ処理装 ϋο
4 0 , コンピュータで読み取り可能な情報を格納した記∞体であって、 コンピュータに、 複数の I Sパラメ一夕と、 誠数の パラメータにより原 ファイルが複数の区間に分割され該区間毎に圧縮された複数の区間データとから 構成される I Sファイルが記録された 媒体へのアクセスを制御させるリ一ド 処理手段と、
コンピュータに、 該リード処理手段により^!媒体から読み出される区間 デー夕を、 該区間デ一夕に対応する ffi^、'ラメ一夕により伸長させる伸長処理手 段とを備えたプログラムを格納した、 記憶媒^
4 1. tne複数の ffifttパラメータは、 iti^Mファイル内の語毎の出 ¾¾¾の 分布に基づき作成されている、 請求の範囲第 4 0項言 の記誰体。
4 2. ΙίίΐεΕ^ファイルは、 非 I iの区間データと該区間か ffiftlであるこ とを示す非 IB宿フラグを更に含み、 ltr¾伸長処理手段は、 コンピュータに、 i リ一ド処理手段により Ιίί Ι ^媒体から読み出される区間データが非圧縮を示す とき該区間データの伸長を抑止させる、 請求の範囲第 4 0項言纖の記憶媒体。
4 3. ΐϋΕ各区間の制御龍に itrEi パラメ一夕の翻 «赚を含む、 請求 の範囲第 4 0項纖の記憶媒
4 4. 前記各区間の制御 に区間の終わりを示す終了情報が区間デ一夕に ίίίηιされていないことを示す削除フラグを含み、 リ一ド処理手段は、 コン ピュー夕に、 該削除フラグに基づき最終区間を判断して区間データの読み出しを 制御させる、 請求の範囲第 4 0項 mの記憶媒^
4 5. 蘭己伸長処理手段は、 コンピュータに、 il己^媒体へアクセスさせ るための編 媒体用のドライバソフトウエアにより実行される、 請求の範囲第
4 0項 の記憶媒
4 6. 媒体用のドライバソフトウェアは、 コンピュータのアプリ ケーシヨンソフトウェアとは している、 請求の範囲第 4 5項 lefjの記憶媒体。
4 7. コンピュータで読み取り可能な Itfgを格納した記∞体であって、 コンピュータに、 アプリケーションソフトウエアからの読み出し要求に応じて、 複数の |»ノ、'ラメ一夕と、 数の圧縮ノ、'ラメ一夕により原フアイルか ~m数の区 間に分割され該区間毎に圧縮された複数の区間データとから構成される I tファ ィルが された 媒体へのアクセスを制御させるリ一ド処理手段と、
コンピュータに、該リード処理手段により 媒体から読み出される区間 データを、 該区間データに対応する IBtパラメータにより伸長し、 該アブリケー シヨンソフトウエアに供給させる伸長処理手段とを備えたプログラムを,した、 記憶媒
PCT/JP1999/004387 1999-08-13 1999-08-13 File processing method, data processing device and storage medium Ceased WO2001013237A1 (en)

Priority Applications (7)

Application Number Priority Date Filing Date Title
PCT/JP1999/004387 WO2001013237A1 (en) 1999-08-13 1999-08-13 File processing method, data processing device and storage medium
CNB998169056A CN1167014C (zh) 1999-08-13 1999-08-13 文件处理方法和数据处理装置
EP99937058A EP1211601A4 (en) 1999-08-13 1999-08-13 FILE PROCESSING METHOD, DATA PROCESSING DEVICE AND STORAGE MEDIUM
CA002387653A CA2387653C (en) 1999-08-13 1999-08-13 File processing method, data processing device and storage medium
AU51977/99A AU771959B2 (en) 1999-08-13 1999-08-13 File processing method, data processing device and storage medium
KR1020027001931A KR100597513B1 (ko) 1999-08-13 1999-08-13 파일 처리 방법, 데이터 처리 장치 및 기억 매체
US10/073,245 US7016908B2 (en) 1999-08-13 2002-02-13 File processing method, data processing apparatus and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP1999/004387 WO2001013237A1 (en) 1999-08-13 1999-08-13 File processing method, data processing device and storage medium

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US10/073,245 Continuation US7016908B2 (en) 1999-08-13 2002-02-13 File processing method, data processing apparatus and storage medium

Publications (1)

Publication Number Publication Date
WO2001013237A1 true WO2001013237A1 (en) 2001-02-22

Family

ID=14236462

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP1999/004387 Ceased WO2001013237A1 (en) 1999-08-13 1999-08-13 File processing method, data processing device and storage medium

Country Status (7)

Country Link
US (1) US7016908B2 (ja)
EP (1) EP1211601A4 (ja)
KR (1) KR100597513B1 (ja)
CN (1) CN1167014C (ja)
AU (1) AU771959B2 (ja)
CA (1) CA2387653C (ja)
WO (1) WO2001013237A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100388612B1 (ko) * 2001-07-25 2003-06-25 엘지전자 주식회사 교환 시스템에서의 패키징 압축 방법
JP2007219882A (ja) * 2006-02-17 2007-08-30 Makoto Goto ファイル格納装置
JP5336645B1 (ja) * 2012-12-17 2013-11-06 義尚 神山 倍数乗数分割ソフトウェアを記録した記録媒体

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003006216A (ja) * 2001-06-26 2003-01-10 Sony Corp 情報処理装置および情報処理方法、記録媒体、プログラム、並びに電子出版用データ提供システム
US7162584B2 (en) * 2003-12-29 2007-01-09 Intel Corporation Mechanism to include hints within compressed data
US8099791B1 (en) * 2004-06-25 2012-01-17 Lexmark International, Inc. Method of authenticating a consumable in an imaging device
US8677123B1 (en) 2005-05-26 2014-03-18 Trustwave Holdings, Inc. Method for accelerating security and management operations on data segments
CN100565513C (zh) * 2006-08-30 2009-12-02 绿创科技股份有限公司 文件处理方法及其相关的图案显示方法
US20090112900A1 (en) * 2007-10-31 2009-04-30 Krishnamurthy Viswanathan Collaborative Compression
US8234310B2 (en) * 2007-12-20 2012-07-31 Pottenger William M Social networking on a website with topic-based data sharing
US8239492B2 (en) * 2007-12-20 2012-08-07 Pottenger William M System for content-based peer-to-peer indexing of data on a networked storage device
US8301768B2 (en) * 2007-12-20 2012-10-30 Pottenger William M Peer-to-peer indexing-based marketplace
US8572071B2 (en) * 2008-12-19 2013-10-29 Rutgers, The State University Of New Jersey Systems and methods for data transformation using higher order learning
US8229972B2 (en) * 2009-08-28 2012-07-24 International Business Machines Corporation Extended data storage system
KR101074010B1 (ko) * 2009-09-04 2011-10-17 (주)이스트소프트 블록 단위 데이터 압축 및 복원 방법 및 그 장치
WO2011110003A1 (zh) * 2010-08-24 2011-09-15 华为技术有限公司 二叉树建立、压缩和查找的方法和装置
US8484170B2 (en) * 2011-09-19 2013-07-09 International Business Machines Corporation Scalable deduplication system with small blocks
JP6107513B2 (ja) * 2013-07-29 2017-04-05 富士通株式会社 情報処理システム、情報処理方法、および情報処理プログラム
CN106169020A (zh) * 2016-06-27 2016-11-30 臻和(北京)科技有限公司 一种数据处理方法和基于基因分型的肿瘤伴随诊断系统
JP6794782B2 (ja) * 2016-11-02 2020-12-02 富士通株式会社 情報処理装置、情報処理プログラム、及び情報処理方法
CN108509308A (zh) * 2018-02-08 2018-09-07 广州视源电子科技股份有限公司 板卡数据监控方法、系统、可读存储介质及计算机设备
CN110442489B (zh) * 2018-05-02 2024-03-01 阿里巴巴集团控股有限公司 数据处理的方法和存储介质
CN111382855B (zh) * 2018-12-28 2022-12-09 上海寒武纪信息科技有限公司 数据处理装置、方法、芯片及电子设备
CN112416315B (zh) * 2020-06-16 2024-05-14 上海哔哩哔哩科技有限公司 Css代码的压缩方法、电子设备和存储介质
CN116346940B (zh) * 2023-05-29 2023-08-22 德州禹工环保设备有限公司 一种智慧海绵城市的监测管理系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04359315A (ja) * 1991-06-05 1992-12-11 Matsushita Electric Ind Co Ltd データ圧縮制御装置及びデータ復元制御装置

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5333313A (en) * 1990-10-22 1994-07-26 Franklin Electronic Publishers, Incorporated Method and apparatus for compressing a dictionary database by partitioning a master dictionary database into a plurality of functional parts and applying an optimum compression technique to each part
JPH04225625A (ja) * 1990-12-27 1992-08-14 Sony Corp ディジタル変調方式
US5414850A (en) * 1991-08-23 1995-05-09 Stac Electronics, Inc. System for transparently compressing data files in a computer system
JPH0628150A (ja) 1992-07-08 1994-02-04 Funai Techno Syst Kk プログラム容量圧縮方法
US5442350A (en) 1992-10-29 1995-08-15 International Business Machines Corporation Method and means providing static dictionary structures for compressing character data and expanding compressed data
JP3051014B2 (ja) 1993-12-27 2000-06-12 ローム株式会社 データ記憶装置及びデータシステム
JPH08241325A (ja) 1995-03-03 1996-09-17 Matsushita Electric Ind Co Ltd 電子辞書及びその製造方法並びにインデックス圧縮・伸長装置
JPH0926969A (ja) 1995-07-10 1997-01-28 Hitachi Maxell Ltd 電話帳検索システム
JPH0926902A (ja) 1995-07-12 1997-01-28 Fujikura Ltd ファイル圧縮並びに復元方法
US5809295A (en) * 1995-09-26 1998-09-15 Microsoft Corporation Method and apparatus for storing compressed file data on a disk where each MDFAT data structure includes an extra byte
US5951623A (en) * 1996-08-06 1999-09-14 Reynar; Jeffrey C. Lempel- Ziv data compression technique utilizing a dictionary pre-filled with frequent letter combinations, words and/or phrases
US5797008A (en) * 1996-08-09 1998-08-18 Digital Equipment Corporation Memory storing an integrated index of database records
US6112208A (en) * 1997-08-25 2000-08-29 Fujitsu Limited Data compressing method and apparatus to generate bit maps in accordance with extracted data symbols
EP0962865A4 (en) 1997-10-21 2004-11-24 Fujitsu Ltd FILE PROCESSING METHOD, FILE PROCESSING ARRANGEMENT AND STORAGE MEDIUM
US6438556B1 (en) * 1998-12-11 2002-08-20 International Business Machines Corporation Method and system for compressing data which allows access to data without full uncompression
US6574627B1 (en) * 1999-02-24 2003-06-03 Francesco Bergadano Method and apparatus for the verification of server access logs and statistics
US6349372B1 (en) * 1999-05-19 2002-02-19 International Business Machines Corporation Virtual uncompressed cache for compressed main memory
US6879988B2 (en) * 2000-03-09 2005-04-12 Pkware System and method for manipulating and managing computer archive files

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04359315A (ja) * 1991-06-05 1992-12-11 Matsushita Electric Ind Co Ltd データ圧縮制御装置及びデータ復元制御装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
HIDE AMAKASU ET AL.: "Koredemo mada DOS6 ni shinai?", GEKKAN ASUKII, KABUSHIKI KAISHA ASUKII, vol. 18, no. 5, 1 May 1994 (1994-05-01), (TOKYO), pages 241 - 264, XP002937007 *
See also references of EP1211601A4 *
TOMOHIKO UEMATSU ET AL.: "Program ya text data no tameno kagyaku asshuku algolism wo rikaisuru", INTERFACE, CQ SHUPPANSHA ED., vol. 18, no. 8, 1 August 1992 (1992-08-01), (TOKYO), pages 88 - 123, XP002937006 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100388612B1 (ko) * 2001-07-25 2003-06-25 엘지전자 주식회사 교환 시스템에서의 패키징 압축 방법
JP2007219882A (ja) * 2006-02-17 2007-08-30 Makoto Goto ファイル格納装置
US9262426B2 (en) 2006-02-17 2016-02-16 Makoto Goto File storage apparatus
JP5336645B1 (ja) * 2012-12-17 2013-11-06 義尚 神山 倍数乗数分割ソフトウェアを記録した記録媒体

Also Published As

Publication number Publication date
EP1211601A4 (en) 2004-03-10
KR20020020814A (ko) 2002-03-15
EP1211601A1 (en) 2002-06-05
KR100597513B1 (ko) 2006-07-10
CA2387653A1 (en) 2001-02-22
US7016908B2 (en) 2006-03-21
CN1167014C (zh) 2004-09-15
AU771959B2 (en) 2004-04-08
US20020078062A1 (en) 2002-06-20
CN1367896A (zh) 2002-09-04
CA2387653C (en) 2006-11-14
AU5197799A (en) 2001-03-13

Similar Documents

Publication Publication Date Title
WO2001013237A1 (en) File processing method, data processing device and storage medium
JP4660607B2 (ja) 拡張可能ファイル形式
JP5831298B2 (ja) プログラム、情報処理装置およびインデックス生成方法
JP6550765B2 (ja) 文字データ変換プログラム、文字データ変換装置および文字データ変換方法
US20160211863A1 (en) Converting device and converting method
JP6648620B2 (ja) 符号化プログラム、符号化装置および符号化方法
CA2275391C (en) File processing method, data processing device, and storage medium
AU2002340246A1 (en) Extensible computer file format
JP6511836B2 (ja) 圧縮プログラム、圧縮方法、圧縮装置および伸長プログラム
US9577666B2 (en) Method and system
JPWO1999021092A1 (ja) ファイル処理方法、データ処理装置及び記憶媒体
KR20130111170A (ko) 압축 및 신장 시스템, 압축 장치, 신장 장치, 압축 및 신장 방법, 압축 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체, 및 신장 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체
JP6252489B2 (ja) 圧縮装置、圧縮方法、圧縮プログラム、伸張装置、伸張方法、伸張プログラム、および圧縮伸張システム
JPH06202921A (ja) ファイル圧縮処理装置
JPH07261937A (ja) 圧縮データの読出・書込方法および装置
JP4804836B2 (ja) データ生成装置及びデータ生成プログラム
JP2013101470A (ja) データベース圧縮装置
JPH1069409A (ja) 可換記憶媒体及び制御方法及び計算機システム
JPWO2001013237A1 (ja) ファイル処理方法、データ処理装置及び記憶媒体
JP2016134754A (ja) 変換処理プログラム、情報処理装置および変換処理方法
JP2005129071A (ja) データ圧縮/復元装置およびデータ圧縮/復元方法
JP2000163410A (ja) 文字処理装置及び文字処理プログラムを記録したコンピュータ読み取り可能な記録媒体
JPH11327973A (ja) ファイル管理装置、ファイル管理方法およびファイル管理プログラムを記録した媒体
JP2005137015A (ja) データ圧縮/復元装置およびデータ圧縮/復元方法
JPH11143748A (ja) コンピュータシステムにおけるファイル圧縮管理装置とファイル圧縮管理方法および該方法を記録した記録媒体

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AU CA CN JP KR US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE CH CY DE DK ES FI FR GB GR IE IT LU MC NL PT SE

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 2387653

Country of ref document: CA

WWE Wipo information: entry into national phase

Ref document number: 1999937058

Country of ref document: EP

Ref document number: 10073245

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 1020027001931

Country of ref document: KR

WWE Wipo information: entry into national phase

Ref document number: 51977/99

Country of ref document: AU

WWE Wipo information: entry into national phase

Ref document number: 998169056

Country of ref document: CN

WWP Wipo information: published in national office

Ref document number: 1020027001931

Country of ref document: KR

WWP Wipo information: published in national office

Ref document number: 1999937058

Country of ref document: EP

WWG Wipo information: grant in national office

Ref document number: 51977/99

Country of ref document: AU

WWG Wipo information: grant in national office

Ref document number: 1020027001931

Country of ref document: KR