TW312771B - - Google Patents

Download PDF

Info

Publication number
TW312771B
TW312771B TW086100774A TW86100774A TW312771B TW 312771 B TW312771 B TW 312771B TW 086100774 A TW086100774 A TW 086100774A TW 86100774 A TW86100774 A TW 86100774A TW 312771 B TW312771 B TW 312771B
Authority
TW
Taiwan
Prior art keywords
data
bit
bit string
input
dictionary
Prior art date
Application number
TW086100774A
Other languages
English (en)
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Application granted granted Critical
Publication of TW312771B publication Critical patent/TW312771B/zh

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/3084Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method
    • H03M7/3088Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method employing the use of a dictionary, e.g. LZ78

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Document Processing Apparatus (AREA)

Description

經濟部中央揉準局貝工消费合作社印製 312771 at B7 五、發明説明(1 ) 發明背景 未發明係有關一種壓縮與解壓縮資料之方法與裝置, 以及一種使用該方法與裝置的資料處理裝置與網路系統, 其中包含一字串或類似者之資料,被轉換成包含許多資料 位元之一位元串列,該資料位元的數目小於該原始資料的 位元數。 使用該資料壓縮技術以減少佔據一儲存設施(例如一 硬式磁碟)之資料的比率以及將於資料通訊中被轉移之資 料的數量,藉以改進該儲存裝置與通訊路徑之使用效率。 在先前技藝中,具有代表性的資料壓縮方法包含LZ 78與其 —種改進的變化(被描述在1994年由Toppan所出版之"資料 壓縮手冊(Data Compression Handbook)·'的第 221 至 247 頁 中)。 該LZ 7 8與其變化包含以下根據一預定法則壓縮資料之 基本步驟。 (1) 出現於輸入資料中之字串,.以一組字串之形式儲 存於一儲存器中。該組被稱爲一動態字典。 (2) 當已儲存於該動態字典中之一字串再度出現在該 輸入資料中時,產生該字串之一索引(一般爲一正整數)作 爲輸出資料,以取代該動態字典中之字串》 (3) 當該動態字典充滿累積於其中之字串時,停止該 字串之暫存或刪除被暫存之字串。在刪除的操作中,所有 的字串被刪除,或者從最早的字串開始被適當地刪除。 根據先前技藝的方法,由於包含多個字元及/或字母 本紙張尺度逋用中國國家標率(CNS > A4说格(210X297公釐) 83. 3.10,000 ^^1 ^^1 im ^^1 —^ϋ ^^1 ^^1 ^^1 i n (請先閲讀背面之注$項再填寫本頁) 訂 -線_ ―4 一 經濟部中央標準局β;工消费合作社印製 本紙張尺度逋用中國國家梂準(CNS )人4规洛(210Χ297公釐) 312771 B7 五、發明说明(2 ) 之一字串可由一索引加以取代’經由該資料壓縮可將資料 量最小化。此外’根據該法則,藉由以相反方向完成上述 處理步驟,該被壓縮資料可輕易地加以解壓縮。 然而,使用該動態字典的習知資料壓縮方法具有以下 的問題。 (1) 首先出現在該輸入資料中之一字串並未被暫存至 該動態字典。因此,該字串無法代替一索引,因此被直接 地輸出至該字典。亦即’在該輸入資料的前導或第一部分 中之壓縮比明顯地減少。 (2) 由於該輸入資料的字串被循序地暫存至該動態字 典;因此可能發生一字典溢流。爲了應付這種困難,被儲 存之字串將被刪除,例如,如下所示。 (a) 字串至該字典的暫存被中斷。 (b) 儲存於該字典中的所有字串完全被刪除,然後該 字典被初始化。 (c) 較早的字串由該字典刪除,以便將較不早的字串 保留其中。 在這些刪除程序的任何一種情況下,任何一個在該動 態字典中之字串匹配該輸入資料中之一字串的機會,無法 必然地增加。一般而言,一字串匹配任何一個在該動態字 典中之字串的機率很小,因此壓縮比減少。 發明摘要 因此’本發明的一個目的,在於提供一種可以一高壓 83. 3.10,000 ----^------裝------訂 絲 (請先閲讀背面之注意事項再填寫本頁) 5 312771 A7 B7 經濟部中央標準局®C工消费合作社印製 五、發明説明(3 ) 縮比壓縮資料之壓縮資料的方法與裝置。 本發明的另一個目的,在於提供用來壓縮資料之一方 法與一裝置,其中在該輸入資料之第一部分的壓縮比並未 減少。 , 本發明的另一個目的,在於提供一種方法與一種裝置 ,可防止由以一高頻率出現且佔該字典一大量區域之小字 串所造成的壓縮比之減少。 本發明進一步的目的,在於提供用來解壓縮該被壓縮 資料之一方法與一裝置。 本發明的另一個目的,在於提供用來處理資料之一方 法與一裝置,包含資料壓縮與解壓縮功能。 本發明的一個目的,在於提供一種包含資料壓縮與解 壓縮功能之網路系統。 爲了達成上述目的,根據本發明提供以下組態。 首先,一動態字典與一靜態字典被共同地使用,其中 該靜態字典的內容並未改變。具有一高出現頻率之相當長 的字串與其索引,被暫存至該靜態字典。被壓縮資料包含 動態字典之索引資料及該靜態字典之索引。 特定地,輸出一碼,指出該輸入字串(以下將被稱爲 一輸入位元串列)、該動態字典之索引、該靜態字典之索 引以及表示將被使用在該解碼操作中的動態與靜態字典之 一碼中的任何一個。在此種過程中,將該輸入位元串列之 碼的長度加以儲存。在通過該靜態字典的檢取中,將匹配 該輸入位元串列之索引的碼之至少一長度加以儲存。同樣 ---------裝— (請先閲讀背面之注意事項再填寫本頁) 訂 镖 本紙張尺度通用中國國家揉準(CNS) A4現格(210X297公釐) 83. 3.10,000 -6 - 經濟部中央標準局員工消费合作社印製 A7 ___B7 五、發明説明() 4 地,在通過該動態字典的檢取中,將匹配該輸入位元串列 之索引的碼長度加以儲存。由該輸入位元串列之碼與該上 述索引之碼所選擇的最短者,被輸出作爲被壓縮資料。 此外,可採用一種方法,其中當在該靜態字典中檢取 一目標位元串列時,該靜態字典之索引被輸出。 再者,可採用一字典切換方法,其中爲了使用該動態 字典之索引無法完成資料壓縮之一部分,亦即,該輸入資 料之第一部分,例如,其前面500位元組,可使用該輸入 位元串列之碼或該靜態字典之索引加以編碼。 這些方法中的任何一個,解決上述(1)之問題》 其次,爲了解決問題(2),採用以下程序的任何一個 ,包含①具有一低使用頻率或程度的字串並未被暫存至該 動態字典,以及②預測由該字典之一溢流事件,藉以由該 動態字典刪除具有一低使用程度之字串。 在程序①中,特定地,匹配該靜態字典中之一資料項 目的輸入位元串列並未被暫存至該動態字典。 再者,可利用一程序,其中預先調査被使用在該位元 串列至該動態字典的暫存中之索引,以便將該適切的索引 編碼成輸出資料。當該動態字典之索引最後小於該動態索 引時,其暫存被完成。 此外,由該靜態字典之屬性資訊、出現機率、以及位 元串列之間的關係中所選擇的至少一個,可被用來作爲附 加資訊,以便根據該附加資訊暫存該輸入位元串列。 在程序②中,具體而言,該靜態字典之每一位元串列 本紙張尺度適用中國國家梂準(CNS ) A4規格(210X297公釐) ----------^------1T------& (請先Μ讀背面之注意事項再填寫本頁) -7 - 經濟部中央標準局貝工消费合作杜印裝 312771 ;, 五、發明説明() 5 與該附加資訊項目(包含屬性資訊、出現機率、以及位元 串列之間的關係)中的至少一個共同界定,使得具有一低 使用程度之位元串列中的至少一個,根據該附加資訊由該 動態字典刪除。 再者,可使用一種過程,其中該動態字典的大小之上 限值與被暫存之位元串列的數目之上限值中任一者,以及 該動態字典的大小之目前值與被暫存之位元串列的數目之 目前值中住一者被儲存。在該目前值超過該上限值之一溢 流事件中,該系統參考該靜態字典中之位元串列的附加資 訊,以便根據該參考操作之結果,將該位元串列由該動態 字典刪除》 藉由上述過程中之任一者,可解決問題(2)。 當該資料壓縮方法與裝置根據本發明加以實行時,必 須組構一包含具有一高出現頻率之位元串列的靜態字典。 在本發明一較有利的組態中,該靜態字典包含:由包含自 然語言(例如英文與日文)的至少一單一文字之一群組所選 擇的至少任一者或其一部分、該程式語言之至少一保留字 或其一部分、以及該機器語言之至少一指令文字或其一部 分。特別地,該靜態字典之內容包含自然語言之字串,或 是作爲自然語言之名目表示法的字串。將屬性資訊附加至 該字串,語音部分、文字形式之變化、文字之意義 '表示 法等等因而被界定· 在本發明之資料壓縮方法與裝置被實行的一種情況中 ,將小心地考慮該靜態與動態字典之表格組態,以及管理 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) — 裝 i I 線 (請先閲讀背面之注意事項再填寫本頁) 經濟部中央標準為負工消費合作社印製 A7 B7 五、發明説明(6 ) 個別字典之程式的選擇。在該資料壓縮裝置之一特別有利 的結请中包含一動態字典與一靜態字典,該動態字典包含 最多爲21°至215(1K至32K)的索引,而該靜態字典包含最 多爲21 2至2 17(4K至128)的索引。此外,提供一初始化顯 、示幕,以便選擇產生該靜態字典之一程式、將輸入位元串 列暫存至該動態字典之一程式、以及由該動態字典刪除被 暫存的位元串列之一程式,以便爲該靜態與動態字典設定 資料壓縮條件》 再者,當實行本發明之資料壓縮方法與裝置時,必須 在該壓縮來源與目的地之間共享該靜態字典。根據本發明 *經由一網路於一檔案轉移操作中實施該資料壓縮。該資 料壓縮可於以下之組態中完成。當該解碼目的地之裝置可 被識別時,採用一種程序,其中在該靜態字典使用之前, 該靜態字典之共用被確認。可選擇地,可提供一種用於該 靜態字典之一般索引。在此種情況下,該壓縮來源根據對 該壓縮器獨特之一索引,把將被編碼之資料壓縮成該一般 目的索引,然後將該被壓縮資料轉移至該解碼目的地。然 後,根據該一般索引,該資料被轉換成對該解碼器獨特之 一索引。 如上所述,根據本發明之資料壓縮方法,與僅使用該 動態字典之資料壓縮方法相比較,資料壓縮比得以增加。 圖式之簡要說明: 藉由參照以下之說明與附隨之圖式,本發明這些與其 本紙張尺度適用中國國家標準(CNS > A4规格(210X297公釐) 83. 3.10,000 --------秀—— (請先閲讀背面之注意事項再填寫本頁) -a Γ -9 一 312771 A7 B7_ 五、發明説明(7 ) 他的目的與優點將變得明顯,其中: / 圖1爲一流程圖,顯示一種除了使用一動態字典之外 ,還使用一靜態字典之資料壓縮程序; 圖2爲一圖表,顯示採用一動態字典與一靜態字典之 、資料壓縮器的構造; 圖3爲一圖表,用來解說一種使用一動態字典與一靜 態字典以選擇具有一較短位元長度之一索引的程序; 圖4爲一圖表,用來解說一種過程,其中由輸入位元 串列以及該動態與靜態字典個別的索引所選擇之最短者, 被輸出爲壓縮過之資料; ’圖5爲一流程圖,顯示一種優先使用該靜態字典之資 料壓縮方法; 圖6爲一流程圖,顯示一種使用一字典切換操作之資 料壓縮方法; 圖7爲一流程圖,用來解說一種程序,其中匹配該靜 態字典之一位元串列並未被暫存至該動態字典; 圖8爲一流程圖,顯示一種程序,其中將該靜態與動 態字典個別之索引加以計算,而當該動態字典之索引較該 靜態字典之索引短時,該位元串列被暫存至該動態字典; 圖9爲一圖表,顯示包含自然、程式、與機器語言之 至少一字串及其附加資訊之靜態字典的佈局之一範例; 圖10爲一圖表,顯示包含語法規則作爲該附加資訊之 靜態字典的佈局之一範例; 圖11爲一圖表,顯示該附加資訊之另一佈局範例; 本紙張尺度適用中國國家揉準(CNS > A4規格(210X297公釐} ---------1------1T------.^ (請先S讀背面之注$項再填寫本頁) 經濟部中央梂準局貞工消费合作社印装 83. 3.10,000 ~ 10 - 312771 A7 B7 經濟部中央梯準局貝工消費合作社印策 五、發明说明(8 ) 圖12爲一流程圖,顯示一種程序,其中具有一低使用 程度;£位元串列被刪除,以保留一用於其他位元串列暫存 之區域; 圖13爲一圖表’,顯示用來根據附加資訊由該靜態字典 刪除位元串列之構造; 圖14爲一圖表,顯示用來初始化程式類型與壓縮條件 之結構; 圈15爲一圖表,顯示該靜態字典一實施例之構造: 圖16爲一流程圖,顯示當該靜態字典可於一分散式系 統中共享時,用來完成本發明之一程序; 圖17爲一圖表,顯示當該靜態字典無法於一分散式系 統中共享時,根據本發明之一組態; 圖18爲一圖表,顯示根據本發明之被壓縮資料的佈局 與個別索引之間的關係; 圖19爲一圖表,顯示使用該動態與靜態字典之一資料 解壓縮器的結構:以及 圖20爲一流程圖,顯示一種程序,其中資料藉著參照 該靜態與動態字典之索引而被解壓縮。 較佳實施例之說明: 現在將描述具體說明一操作(實施例)之範例,其中一 輸入位元串列與一靜態字典中之位元串列加以比較,根據 比較之一結果,將該位元串列暫存至一動態字典中。然而 ’在此種聯繫中,本發明並未受限於該實施例。 ---------餐-- (請先閲讀背面之注^'項再填寫本頁) 本紙張尺度適用中國國家梯準(CNS ) A4現格(210X297公釐) 83.3.10,000 -11 經濟部中央梂準局貝工消费合作社印製 312771 A 7 B7 五、發明説明(9 ) 首先,參照圖1、2、7與8,將描述該實施例之大綱。 ή 2顯示採用該動態與靜態字典之一資料壓縮裝置的 構造。該資料壓縮器2QQ接收輸入資料2D1作爲一輸入值, 藉著減少該輸入資料201之資料量,將該資料壓縮成被壓 、縮資料205。該壓縮器200由一種作爲一資料處理裝置之電 腦加以實行,例如,一個人電腦。可選擇地,該壓縮器可 藉由一連結於一電腦與一網路之間的專用設施加以實現。 該壓縮器200包含一動態字典控制器230、一靜態字典控制 器240、以及用來監督該壓縮器200整個過程之一控制器 220。例如,該整體控制器220包含一電腦之一中央處理單 元(CPU),該電腦在一作業系統(OS)控制之下作業。該控 制器22 0進一步監督用來輸入將被壓縮之資料的機構221, 以及用來由其輸出被壓縮之資料的機構251。 該動態字典控制器230包含一動態字典231、產生機構 232、檢取機構233與暫存機構234。該動態字典231爲一用 來將位元串列與索引儲存於其中之資料庫,並且在一電腦 系統之一儲存器中建構,例如,在一併入一電腦系統之硬 式磁碟系統中。該產生機構232、檢取機構233與暫存機構 234由管理與處理該動態字典231之程式加以實行。 這些程式被儲存在該電腦系統之硬式磁碟上,並且由 該電腦系統呼叫,以便於其主儲存器之上移動。這些程式 由中央處理單元加以執行,以便完成個別的預定功能。 該靜態字典控制器240包含一靜態字典241、產生機構 242、檢取機構243與暫存機構244。該靜態字典241爲一種 本紙張尺度逋用中國國家梂準(CNS ) A4规格(210X297公釐) 83. 3.10,000 -12 - ---------^------,ΤΓ------0 (請先閲讀背面之注$項再填寫本頁) 經濟部中央梂準局貝工消费合作社印製 A7 B7 五、發明説明(10 ) 位元串列與索引將被儲存於其中之資料庫。該資料庫於一 電腦乏一儲存器中形成,例如,在一併入一電腦系統之硬 式磁碟系統中。該產生機構232、檢取機構233與暫存機構 234由操縱與處理該動態字典231之程式加以實現。 上述程式被儲存在該電腦系統之硬式磁碟上,並且由 該電腦系統呼叫,以便於其主儲存器之上移動。然後這些 程式由中央處理單元加以執行,以便開發預定的功能。 該輸入機構221與輸出機構251包含藉由該電腦系統此 一內部儲存器(例如一硬式磁碟單元)、經由一網路之一遠 端檔案系統、及/或一外部儲存器(例如一軟式磁碟或一磁 帶),以分別完成資料輸入與輸出操作之程式(裝置驅動器 )。該輸入機構221接收且轉換輸入資料201成一種將由其 輸出之输入位元串列202。該輸出機構251接收一輸出位元 串列2 0 4,其爲一種由該動態字典2 3 1或該靜態字典2 4 1所 產生之索引,然後將一控制碼203附加至該被接收之位元 串列2G4,藉以產生被壓縮資料205作爲輸出資料。 圖1爲在採用該動態與靜態字典之圖2的裝置中壓縮資 料之一程序的流程圖。該實施例之資料壓縮程序包含產生 或編譯該靜態字典241與該動態字典231之一初始化過程( 步驟100),以及一資料壓縮過程(步驟120)。 首先將描述步驟100。當該系統之一管理者輸入一命 令指定將被壓縮之一檔案與資料時,該壓縮過程開始(步 驟101)。首先該靜態字典241由產生機構242產生(步驟102 )。特定地,位元串列與索引被界定,例如,根據一文字 本紙張尺度逋用中國國家揉準(CNS > A4规格(210X297公釐) 83.3.10,000 (請先《讀背面之注$項再填寫本頁) r
T -13 - 經濟部中央梯準局貝工消费合作社印裝 312771 A7 B7 五、發明説明(11 ) 處理器之一字典與一電子字典之字串。隨後,該動態字典 231藉由產生機構232被初始化,亦即,空白或預定的位元 串列被暫存至該動態字典231(步驟103)。在該動態字典 231之初始化中,空白的位元串列可被暫存至該動態字典 ,或者其可能暫存包含預定位元串列之基本位元串列,例 如ASCII碼系統之文字碼與其他碼,以及JIS碼系統之文字 碼、片假名(一種日本字母)與平假名(另一種日本字母)》 視該初始化模式、所使用之電腦的儲存容量、及/或用於 索引檢取之一雜湊表(hash table)的結構而定,道些初始 化過程中的任何一個可加以利用。當上述步驟結束時,該 初始化過程便已完成(步驟104)· 在此實施例中,該靜態字典241產生於該動態字典231 之前,然而,其並未限制本發明。亦即,該動態字典231 可於該靜態字典241之前產生。此外,雖然在該實施例中 ’該預定的位元串列包含ASCI I碼系統之文字碼與其他碼 ,以及JIS碼系統之文字碼、片假名(一種日本字母)與平 假名(另一種日本字母),本發明並未受到此實施例之限制 。亦即,其可能採用任何其中每一字元根據一預定法則加 以獨特地界定之碼系統。 隨後’將描述步驟120。當該靜態字典241之產生被確 認時’資料壓縮過程開始(步驟121)。首先,將被壓縮之 資料被輸入至該系統(步驟122)。例如,當該系統使用 UNIX加以實fr時,以標準的輸入模式輸入具有—·特定名稱 之一檔案或資料。根據一預定區段單元(例如,每一區段 本紙張尺度適用中國國家揉準(CNS ) A4规格(210X297公釐) 83. 3.10,000 -----------裝— (請先閲讀背面之注意事項再填寫本頁) 訂_ -锊_ 14 - 經濟部中央揉率局貝工消费合作社印*. A7 B7 五、發明説明(12 ) 64位元),該輸入資料201藉由輸入機構221被解組譯或分 解成*入位元串列202(步驟123)。其次,使用每一輸入位 元串列2 0 2作爲一檢取鍵,藉由決策機構243與參考機構 244完成通過該靜態字典241之一搜尋操作,其將於該決策 、機構243之後開始(步驟124)。此後,該輸入位元串列202 與一由該靜態字典241獲得之位元串列加以比較(步驟125) 〇 使用比較之結果,以及藉由經過該動態字典231之檢 取機構233由該位元串列檢取所獲得者,決定是否該輸入 位元串列將被暫存至該動態字典231(步驟126)。當處於這 種情況下時,藉由暫存機構234,該輸入位元串列202隨著 一索引被暫存至該動態字典(步驟127)。否則,並未完成 任何特定的操作。最後,該輸入位元串列202或匹配該串 列202之索引被輸出爲被壓縮資料205(步驟128)。當存在 另一輸入資料時,控制回到步驟丨〗?;否則,該資料壓縮 過程終止(步驟129與130)。 在此種關聯中,雖然當該資料壓縮過程120在步驟130 中終止時,爲了其後之輸入資料,該靜態字典241藉由上 述實施例中之初始化過程1 〇〇加以初始化,然而本發明並 未受限於該實施例。亦即,該靜態字典2 4 1可以一種半固 定的方式產生,使其不必在該資料壓縮過程12 0終止之後 ’爲了隨後之輸入資料初始化該靜態字典241。此種程序 導致一種使處理時間最小化的有利效果。 現在參照圖7與8,其詳細描述將該輸入位元串列與該 本紙張尺度逋用中國國家標準(CNS ) A4規格(210X297公釐) 83.3.10,000 -15 - ---------1------ir------^ (請先閲讀背面之注$項再填寫本頁) 經濟部中央揉率肩貝工消费合作社印製 A 7 ____B7 五、發明説明(13 ) 靜態字典中之一位元串列比較之處理步驟125的兩個實施 例。’ 在圖7之流程圖中,當該輸入位元串列匹配該靜態字 典241中之位元串列時,該輸入位元串列並未暫存至該動 、態字典231。指定該輸入位元串列作爲一檢取鍵,完成通 過該靜態字典241之一位元串列檢取操作(步驟701),藉以 決定是否該輸入位元串列匹配該靜態字典241中之一位元 串列(步驟702)。當一匹配情況產生時,該輸入位元串列 並未暫存至該動態字典231(步驟703)。否則,該輸入位元 串列被暫存至該動態字典(步驟704)。根據該實施例,可 有利地減少暫存至該動態字典231之位元串列的數目。 在圖8之流程圖中,當該輸入位元串列匹配該靜態字 典241中之一位元串列時,該系統分別計算在該靜態與動 態字典241與231中之索引的長度。當該動態字典231之索 引較小時,該輸入位元串列被暫存至該動態字典231。圖8 之步驟701至704與圖7相同。指定該輸入位元串列作爲一 搜尋鍵,完成通過該靜態字典241之一位元串列搜尋(步驟 701 ),以決定是否該輸入位元串列匹配該靜態字典241中 之一位元串列(步驟702)。當該過程導致一種匹配狀態時 ,摘取一匹配該輸入位元串列之適切的位元串列之索引, 然後記下該索引之長度(步驟801)。利用該輸入位元串列 作爲一檢取鍵,完成通過該動態字典231之一位元串列捜 尋,以決定是否該輸入位元串列匹配該動態字典231中之 一位元串列(步驟811)。當該過程導致一種未匹配之情況 本紙張尺度適用中國國家揉準(CNS ) A4规格(210X297公釐)
1R 83. 3.10,000 — I— II 裝 —訂 II —絲 (請先閲讀背面之注$項再填寫本頁) 312771 A7 B7 經濟部中央揉準局貝工消費合作社印製 五、發明説明(14 ) 時,該系統假定該輸入位元串列被暫存至該動態字典231 ,藉以預測將被指定至該輸入位元串列之一索引,然後記 下該索引之長度(步驟812)。當存在匹配該輸入位元串列 之一位元串列時,並未完成至該動態字典231的暫存(步驟 703)。當步驟702中產生”匹配”,並且在步驟811中決定爲 "不存在”時,記錄於步驟801中之索引與記錄於步驟812中 之索引加以比較(步驟802 )。當該靜態字典241之索引較小 時(步驟803),該輸入位元串列並未被暫存至該動態字典 231(步驟703)。否則(步驟803),該輸入位元串列被暫存 至該動態字典231(步驟704)。當步驟702中產生"未吗配" 時,該輸入位元串列被暫存至該動態字典231(步驟704)。 在該實施例中,根據分別與該靜態與動態字典有關之 輸入位元串列所獲得之索引的長度之間的關係之結果,如 果該動態字典被使用在該適切的位元串列發生時,當一較 高的壓縮比被期待,該輸入位元串列被暫存至該動態字典 。因此,根據該實施例,該壓縮過程偏好以一使用該動態 與靜態字典之較高壓縮比加以完成,藉以由一較高壓縮比 完成該資料壓縮過程。 現在參照圖3、4、5、6與18,將詳細描述該處理步驟 128之一實施例,其中該動態與靜態字典被用來產生該動 態與靜態字典231與241任一者之索引,作爲被壓縮之資料 〇 圖3圖示一種使用該動態與靜態字典選擇具有一較小 位元長度之一索引的操作。當與僅採用動態字典之習知方 ---------^— (請先閱讀背面之注$項存填寫本頁) 訂 線· 本紙張尺度適用中國國家揉準(CNS ) A4規格(210X297公釐) 83.3.10,000 -17 - 經濟部中央梯準為負工消费合作社印装 312771 A7 B7 五、發明说明(15 ) 法相比較時,雖然被壓縮之資料的結構爲複雜的’該壓縮 比受齒改進。 在圖3中,藉由分解一普通句子301所獲得之輸入位兀 串列,匹配界定於該靜態字典中之字串。一般而言,具有 、一相當大的位元長度之字串(例如’包含十個或更多字母 的英文字)被暫存至該靜態字典。再者,長度小於該適切 的字串之一索引被暫存至該靜態字典,藉以改進該壓縮比 該實施例的輸出資料之一範例爲壓縮資料304。該資 料304爲一串列,包含該字典之一索引或位元串列本身204 、識別該項目爲該字典之一索引或位元串列本身之一碼、 以及包含一碼以識別該項目與該動態字典231或該靜態字 典241有關之一控制碼。與藉由僅使用該動態字典之習知 壓縮過程所獲得的被壓縮資料305之碼系統相比較,該碼 系統是複雜的。然而,由於該靜態字典較小的索引大小, 該被壓縮資料304之大小通常小於被壓縮資料305。 其次參照圖4與18,將描述一種實行該程序以產生具 有較小長度之索引的方法。 圖18爲一圖表,顯示該實施例之被壓縮資料的佈局, 以及該資料與索引之間的關係。被壓縮資料項目1801、 1811與1821分別對應於一種其中該輸入位元串列被直接地 編碼之情況、一種其中該動態字典之一索引被編碼之情況 、以及一種其中該靜態字典之一索引被編碼之情況。在此 實施例中,用了解說的簡化,假設該輸入資料包含一以英 本紙張尺度適用中國國家梂牟(CNS ) A4规格(210X297公釐) 83. 3.10,000 ---------1— (請先Μ讀背面之注$項再填寫本頁) 訂 線· -18 - 經濟部中央揲準局負工消费合作社印裝 A7 ______B7_ 五、發明説明(16 ) 文表示之句子,而該資料以一 8位元碼系統(ASCII碼系統) 加以 ίΐ 入。控制碼 1803、1804、1813、1814、1823與 1824 指出該壓縮資料爲該輸入字串之碼、該靜態字典之一索引 、或該動態字典之一索引的碼類型。這些控制碼爲某種未 使用在該資料中作爲一逸出順序之位元串列。在該資料解 碼操作中,輸入至該系統之被壓縮資料,以一種預定的單 位被分解成次資料項目,例如,以一種8位元的單位來識 別該控制碼,使得該位元串列被處理作爲被壓縮資料,直 到一隨後的控制碼出現時。該被壓縮資料1801包含控制碼 1803與1804,而主資料1802介於該控制碼1803與1804之間 。該主資料1802包含具有一固定位元長度之一碼411。在 此種情況下,其長度爲八位元。該被壓縮資料1811包含控 制碼1813與1814,而主資料1812介於該控制碼1813與1814 之間,該主資料1 8 1 2包含一附加之控制碼1 8 1 5。在該動態 字典231中,該資料1812包含一可變長度索引。該控制碼 1815爲一種8位元碼,指示構成該資料1812之索引的長度 。例如,由於該動態字典231之每一索引在圖4之範例中包 含一 6位元碼,一種6位元碼系統之指標被設定至該控制碼 1815。在此種佈局中,該資料1822介於該控制碼1823與18 24之間。在該靜態字典241中,該資料1822包含一索引。 圖4爲一圖表,用來解說一種過程,其中將輸入位元 串列之碼的長度,以及與該輸入位元串列有關之動態與靜 態字典的索引加以訃算,藉以共同決定具有最小資料長度 之一索引》在該實施例中,假定每一具有至少四個字母之 本紙張尺度逋用中國國家標準(CNS ) Α4規格(210Χ297公釐〉 -19 一 83. 3.10,000 ---------^------,ΤΓ------^ (請先閲讀背面之注意事項再填寫本頁) 經濟部中央標準局工消费合作社印装 312771 A7 _______B7 五、發明説明(17 ) 英文字被暫存至該靜態字典。亦即,當以此種組態壓縮這 些英文字時,與其中該英文字之每一字母被編碼或該英文 字被轉換成該動態字典之一索引的操作相比較,採用該靜 態字典乃是有利的。該決策機構243分別計算該輸入位元 、串列之碼以及該動態與靜態字典之索引的長度,然後將這 些長度互相比較,藉以決定最小的長度。該輸入位元串列 202包含8位元碼系統之資料,亦即,一 8位元碼411與一位 元串列412。該靜態字典241包含具有最大長度爲17位元之 一索引241,以及一位元串列42 2。該動態字典包含具有最 大長度爲六位元之一索引,以及一位元串列432。該控制 碼包含八位元。例如,假設作爲該句子401之一構成要素 的文字"This"將被壓縮,該系統計算在個別的表示法中, 需要用來表示該輸入位元串列20 2之碼411、該動態字典 231之索引431、以及該靜態字典241之索引421的位元數β 對該輸入位元串列202之碼411而言,由於每一碼具有一固 定的長度,該碼之長度達到8位元χ4 (構成該位元串列之 字元)。圍繞該項目之控制碼,具有一 8 X 2位元之長度。 其總數則被計算爲8 X 4 + 8 X 2 = 48位元。對該動態字 典231之索引431而言,由於索引之最大長度爲六位元,該 索引之長度達到6位元X 4 (字元)。指示該索引長度6之一 碼爲八位元,而介於該項目之間的控制碼具有一 8 X 2位 元之長度》因此,其總數爲6 X 4 + 8 + 8 X 2 = 48位元 (最大值)。在此範例中,由於對應於"This”之索引爲一 8 位元碼”11111011 ",當在前與隨後的控制碼(8 X 2位元) 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) 83. 3. !〇,〇〇〇 ---------择------ir------線> (請先閲讀背面之注意事項存填寫本荑) -20 - 經濟部中央標準局貝工消费合作社印簟 A7 _B7_ 五、發明説明(18 ) 被附加至該8位元碼時,產生24位元》在此種情況下,該 系統必是使用該靜態字典241之索引421,藉由該決策機構 243選擇編碼過程。根據該範例,當該動態字典231之索引 431或該輸入位元串列2 02之碼411被選擇時,被壓縮資料 之長度可被減少至大約爲所產生之被壓縮資料的一半。 在上述實施例的描述中,將該動態與靜態字典之索引 的長度加以計算,藉以選擇這些字典中的任何一個。其次 將描述另一實施例,其較偏好使用該靜態字典,其中當該 輸入位元串列匹配該靜態字典中之一位元串列時,該靜態 字典之索引無條件地被輸出》再者,其次將描述另一實施 例’,其使用一字典切換過程,其中提供第一處理位置與第 一資料位置之間的距離之一門限值,以便結合該門限值完 成字典之間的一種轉換操作。 圖5爲用來產生匹配該輸入位元串列之靜態字典的索 引以作爲被壓縮資料之一過程的流程圖。此實施例爲偏好 利用靜態字典之一範例,亦即,圖1用來將該輸入位元串 列與該靜態字典之一位元串列加以比較之處理步驟1 2 5的 一個實施例。首先,完成通過該整體靜態字典241之一位 元串列檢取(步驟5 0 1 )。當一匹配情況被偵測到時(步驟 502),假設該輸入位元串列不需要被暫存至該動態字典 231(步驟503),而該靜態字典241之索引將被輸出(步驟 504)。當一未匹配狀態發生在該位元串列時(步驟502), 假設該位元串列需要被暫存至該動態字典(步驟505),而 該輸入位元串列之碼將被輸出(步驟506)。 本紙張尺度逍用中國國家橾準(CNS ) A4規格(210X297公釐) 83.3.10,000 ---------^------1T------^ (請先閲讀背面之注意事項再填寫本頁) -21 經濟部中央標準局負工消费合作社印裂 A 7 __ B7__ 五、發明説明(19 ) 圖6爲該程序之一流程圖,其中對資料處理位置與第 一資科位置之間的距離配置一門限值,使得該輸入位元串 列與靜態字典被使用在由該第一資料位置至與該門限值有 關的位置之一範圍內,而該輸入位元串列及靜態與動態字 、典被使用在超過與該門限值有關的位置之一範圍內。此實 施例爲採用該字典切換過程之一範例,並且爲圖1與4中所 顯示之資料壓縮過程的另一實施例。此過程乃基於經驗法 則,對於檔案之引導部分,使用該靜態字典乃是有效的。 亦即,當處理由該檔案之第一位置至與該門限值結合之位 置此一範圍內的前面部分時,使用該靜態字典之索引,然 而當處理由該門限值之位置至檔案結束此一範圍內的檔案 時,則採用該動態字典之索引。此實施例不同於圖1之步 驟125與126中所顯示者,在圖1中,該靜態字典被使用, 直到預定門限值的位置,而未完成索引長度之計算。 該實施例包含在初始化過程10 0之前設定一門限值的 初始步驟601至6 0 4以產生字典,以及實質上相等於該資料 壓縮過程120之內部過程的處理步驟601至604之壓縮主處 理步驟61 1至617。 首先將描述初始步驟601至604。在這些步驟中,爲了 決定一特定的門限值,必須決定當資料被輸入時,該輸入 資料與一大小已知之檔案有關,或是與終端並未被決定之 流送資料(例如通訊資料)有關(步驟601)。當處理一檔案 時,檢査其檔案大小,以便根據整體大小計算該門限值, 或者視該檔案大小之值而定,選擇一不規則的門限值(步 本紙張尺度逋用中國國家標牟(CNS ) A4规格(210X297公釐) 83. 3.10,〇〇〇 -22 - III — ^裝— — — II 訂—— — — —— 線 (請先閲讀背面之注$項再填寫本筲) 經濟部中央標準局負工消费合作社印製 312771 A7 B7 五、發明説明(20 ) 驟602)。例如,假設該門限值被設定至一相當於該整體大 小百分之十的位置。在此種情況下,如果該檔案之通常大 小爲,例如,十位元組,該門限值被設定至一相當於相對 該檔案第一位置一位元組的位置。然而,當整體大小較大 時,例如,1 0 0位元組,該門限值被不規則地設定至一相 當於相對該檔案第一位置二至三位元組的位置,而不是被 設定至一相對該檔案第一位置十位元組的通常位置。當處 理流送資料時,採用一固定的初始值(步驟603)。當該門 限值被決定時,其值被設定至將於資料壓縮過程中被參考 之一暫存器(步驟6 04 )。 隨後,將描述壓縮主步驟611至617 »在資料壓縮之步 驟121至123之後,相對於該輸入位元串列之第一位置的位 元數被決定(步驟611),以便與步驟604中所指示之門限值 加以比較(步驟6 1 2 )»當未超過該門限值時,實施通過該 靜態字典的位元串列之一位元串列檢取,藉以獲得匹配該 輸入位元串列之一位元串列(步驟613),然後其一索引被 編碼,以產生輸出資料(步驟615)。當在步驟613中產生未 匹配之情況時,該輸入位元串列之碼被編碼成輸出資料( 步驟616),而該適切的位元串列被暫存至該動態字典(步 驟127)。當在步驟612中超過該門限值時,實施通過該動 態字典的位元串列之一位元串列檢取*藉以獲得匹配該輸 入位元串列之一位元串列(步驟614),然後其一索引被編 碼,以產生輸出資料(步驟617)。當在步驟614中產生未匹 配之情況時,將控制交給其後接著步驟127之步驟616。 本紙張尺度逍用中國國家揉準(cns ) A4说格(2丨〇><297公釐) 83. 3.10,000 ----^------裝-- (請先W讀背面之注$項再填寫本頁) 訂 線 23 - A7 B7 五、發明説明(21 ) 在上述過程完成後,當#在另一輸入資料時(步驟129 ),控‘制再度被轉移至步驟122。當此輸入資料不存在時( 步驟129),該資料壓縮過程被終止(步驟130)。 根據該實施例,基本上執行該過程兩次,以便插入用 、於該字典切換操作之一控制碼。亦即,在兩個控制碼插入 過程中,採用指示是否超過該門限值之碼,並且採用指示 是否該適切的字典包含匹配該輸入位元串列之一位元串列 的碼。因此,該過程被簡化,以便有利地將處理時間最小 化。此外,與字典切換經常發生的情況相比較,控制碼的 數目減少,導致該資料壓縮比最後獲得改進的優點。 現在參照圖9與10,將描述一種在一最佳化系統中實 行資料壓縮裝置與程序之方法。特定地,將描述該靜態字 典之一組態範例,其中考慮一種輸入資料201以自然、程 式、及/或機器語言加以描述之實際情況中,屬性資訊、 出現頻率、及/或一種字串之間的關係被明確地加以辨識 ,藉以根據語言特徵改進資料壓縮比。 經濟部中央標準局貝工消费合作社印製 圖9圖示該靜態字典之一實施例,其包含一個或更多 以一種程式語言加以描述之字串及其附加資訊,特定地, 其顯示一靜態字典900,其包含被使用在C語言的控制述句 中之保留字及其附加資訊。根據該實施例的一個特點’對 暫存至該靜態字典900之一字串901,提供指示該字串901 出現兩次以上的機率之一機率9 0 2作爲附加資訊。例如’ 當已知資料壓縮的客體爲一種以C語言撰寫的原始程式時 ,藉著使用一靜態字典作爲該字典900,得自該靜態字典 83. 3.10,000 ---------装-- (請先閲讀背面之注$項再填寫本頁) 锊 本紙張尺度速用中國國家標準(CNS ) A4規格(210X297公釐) -24 - 312771 A7 B7 經濟部中央梂準局貝工消費合作社印製 五、發明説明62 ) 之索引的输出之比率增加,藉以可期待地改進該資料壓縮 比》ai現頻率機率902只需由多個c語言之原始程式預先加 以調査。亦即,所獲得之結果可被採用爲期待值,而不必 顧及輸入資料的內容。在一位元串列被暫存至該動態字典 或由該動態字典刪除的一種情況中,當該出現機率90在該 位元串列之暫存或刪除中被採用爲順位層級時,將考慮增 加該输入位元串列與該動態字典中之一位元串列之間的匹 配機率。此將進一步地改進該資料壓縮比。再者,在此範 例中,由於具有一較高出現機率值之位元串列被指定至具 有一較小位元長度之一索引9 03,因此可期待檢取速度也 會增加。 圖10顯示包含語言法則作爲該附加資訊之靜態字典的 佈局之一範例,其中藉著解壓縮該靜態字典900,將一靜 態字典1 0 0 0加以組構爲包含文字之表示法或用法。例如, 在C語言中,控制述句可以數種態樣有體系地加以描述。 一種在多個保留字之間建立關係之表示法1001與一索引 1002結合。在此範例中,由於該索引1〇〇2由一3個數字之 整數加以表示,包含多個保留字之一組表示法的碼長度, 小於在該索引903被使用的情況下之碼長度。再者,指定 一結構1003用於與該語法規則結合之被壓縮資料。 附帶地,在此實施例中,雖然該靜態字典包含一程式 語言之字串及其附加資訊,然而本發明並未受限於該實施 例。亦即,該靜態字典可包含一個或更多以一種自然、程 式、或機器語言所表示之字串及其附加資訊。 本紙張尺度適用中國國家梂準(CNS ) A4規格(210X297公釐) 83. 3.10,000 (請先閲讀背面之注意事項再填寫本頁) •裝· 订 -銘- -25 - 經濟部中央揉準局負工消费合作社印製 A7 B7 五、發明説明(23 ) 其次參照圖11至13,將描述一實施例’其中該輸入位 元串到與描述於圖9與1 0之靜態字典的位元串列加以比較 。根據比較之結果,該輸入串列並未暫存至該動態字典或 由該動態字典刪除。 圖11爲本發明採用另一種附加資訊之一實施例。該靜 態字典241包含位元串列1101、用來識別分別對應於由該 位元串列1101所表示的用詞或文字之欄位的附加資訊項目 1102、以及索引1103。在輸入資料201的處理中’其內容 由決策機構243加以分析,以便決定與該輸入資料有關之 一欄位。結果,該輸入資料201之暫存被跳過。或者,任 何徐了與該欄位有關之位元串列以外的位元串列,由該刪 除機構1301加以刪除。圖13爲資料壓縮裝置的構造之一範 例,其中建立至該動態字典231的位元串列之暫存的一個 上限值1302,而一法則1311附加地配置於該決策機構24中 ,藉以根據該靜態字典241之附加資訊,刪除具有一低使 用頻率之位元串列。圖13與圖2之差異,在於其配置當一 種溢流情況被該暫存機構偵測到時被呼叫之刪除機構1301 、一種限制將被暫存至該動態字典2 3 1的位元串列數之一 上限值被設定至該處的暫存器1 302、以及一種根據該靜態 字典之附加資訊決定該適切的位元串列之使用頻率的法則 1 3 1 1 1亦即,是否將完成串列刪除。 圖12爲一流程圖,顯示根據圖13中所顯示的資料壓縮 系統中圖9之出現頻率的附加資訊,以便刪除該位元串列 的程序之一實施例》當一種溢流情況在一输入位元串列至 本紙張尺度逋用中國國家梯準(CNS ) A4規格(210X297公釐) 83. 3.10,000 ---------^------、tr------.^ (請先s讀背面之注意事項再填寫本頁) -26 - 經濟部中央揉準局貝工消费合作社印製 A7 B7 五、發明説明(24 ) 該動態字典的暫存中被偵測到時(步驟1 2 7 ),具有一低使 用頻傘或程度之位元串列由該動態字典刪除,藉以保留用 於該串列暫存之一區域。首先,所計算之輸入位元數與該 上限值1302加以比較。當一種溢流發生於該動態字典中時 ’該_除機構1301被初始化,以便將控制交給步驟1202。 否則,該輸入位元串列以通常的方式暫存至該動態字典( 步驟1206)。在該實施例此種情況中,爲了簡化描述,該 刪除機構1301選擇任何具有一低於該輸入位元串列之出現 機率的位元串列作爲刪除客體。首先,該系統參照被提供 作爲該輸入位元串列之附加資訊的出現機率902(步驟1202 ),以便摘取具有一較低出現機率之位元串列。其後,完 成通過該動態字典231中的位元串列之一位元檢取(步驟 1 2 0 3 )。當偵測到具有一較低使用頻率之一位元串列時(步 驟1204),該系統由該動態字典刪除該位元串列(步驟1205 )° 圖14顯示本發明之一實施例的構造,解說一種用來初 始化程式類型與壓縮條件之操作。根據此實施例之一特點 ,由於該靜態字典與多個產生機構2 42有關,且該動態字 典與多個暫存機構234及多個刪除機構1301結合*該使用 者初始化該程式類型與壓縮條件。該系統進一步包含連接 至該資料壓縮器200之終端機1400。該終端機1400包含一 顯示幕1401以初始化該終端機1400,例如,由一表格選擇 條件。資料壓縮之使用者由該設定中的顯示幕1400選擇產 生機構242、暫存機構234、及/或刪除機構1301。此外, 本紙張尺度逍用中國國家揉準(CNS ) A4规格(210X297公釐) 83. 3.10,000 I ^ I I I I I I ^ 裝— I I I I I 訂— 線 (請先閱讀背面之注意事項再填寫本頁) -27 - 經濟部中央橾準局貝工消费合作社印製 312771 A7 __B7_ 五、發明説明(25 ) 該使用者設定,例如,用於該動態字典中之位元暫存與刪 除的門限值與參考值· 圖15顯示該靜態字典之一實施例的結構。根據該實施 例之一特點,提供該動態與靜態字典分別被應用至該處的 彼此不同之範圍,藉以有利地使用該字典。結果,該靜態 與動態字典個別之索引的最大值,需要處在隨後的一種情 況下。在該靜態字典中*暫存許多具有一相當大的位元串 列之字串。每一暫存至該動態字典中的字串,具有一短的 位元長度與一高的出現頻率。特別地,將被暫存之索引與 至該靜態字典之字串,其位元長度較該動態字典者爲小。 作爲該靜態字典的構造之一實施例,將產生一靜態字典 241,其使用一文字處理器包含大約二萬個字之一字典 1501(前端處理器)的至少一資料庫、一大約100字之英文-曰文字典及/或當字元以日文讀取時給予中文字元意義之 中文-字元-日文字典、及/或一與個別特定欄位有關之百 科全書1 5 03。例如,根據一預定的準則,摘取通常儲存於 其中之文字以產生該靜態字典·在此種情況下,該動態字 典包含最多爲21°至215(1K至32K)的索引,且該靜態字典 包含最多爲21 2至217(4Κ至128)的索引,乃是最佳化的。 圖16爲本發明之一實施例的流程圓,其中該壓縮來源 與解碼目的地之靜態字典可於一分散式系統中共享。此實 施例與圖1不同之處,在於在該字典被初始化之後(步驟 100),在資料壓縮120之前實施產生一詢問之一過程,詢 問該相同之字典是否存在於該解碼目的地中。在該壓縮過 本紙張尺度適用中國困家標準(CNS ) Α4規格(210X297公釐) ----------^------1Τ------i (請先閲讀背面之注意事項再填寫本頁) A7 B7 經濟部中央揉準局β;工消费合作社印製 五、發明説明心) 程之前,經由網路連接至該壓縮系統之一裝置,被指定爲 該解碼目的地。當此實施例被應用至一檔案轉移過程(FTP )時,使用一主機名稱與一 IP位址,作爲將被執行之一命 令的引數。當該解碼目的地被決定時(步驟1601),在該壓 縮來源與該解碼目的地之間建立一種連接(步驟1602)。否 則(步驟1601),該過程將被終止。在該連接建立於步驟 1602中之後,確認在該解碼目的地中的靜態字典之一檔案 名稱*然後檢査該靜態字典之版本與構成要素。基於該檢 查操作的結果,決定是否該解碼目的地與該壓縮來源具有 相同的靜態字典(步驟1603)。當處在這種情況下時,該系 統滦用一種使用該動態字典231與該靜態字典241之一過程 (步驟1610)。否則,選擇另一過程,例如,僅使用該動態 字典231壓縮資料之習知過程,或者將該靜態字典241由該 壓縮來源轉移至該解碼目的地之一過程(步驟1604)。然後 解除其間的連接(步驟1615)。在實施步驟1610之後,該資 料由壓縮來源加以壓縮(步驟120),然後被傳送至該解碼 目的地(步驟1611)。在該解碼目的地中,採用一種與步驟 1610之壓縮過程有關的雙向資料解碼方法(步驟1612),一 旦接收到該資料(1613),該解碼來源將該資料解碼(步驟 16 14)。當上述過程完成時,該壓縮來源與該解碼目的地 之間的連接被解除(步驟1615)。 在此種連接中,雖然步驟1610至1614在該實施例中被 循序地執行,然而本發明並未受限於該實施例。亦即,這 些步驟可以一種管線處理方式加以執行。藉著此種方式, ----------务-- (請先聞讀背面之注意事項再填寫本頁) 訂 本紙張尺度適用中國國家榣準(CNS ) A4規格(210X297公釐) 83. 3.10,000 -29 - A7 B7 經濟部中央楳準局貝工消费合作社印装 五、發明说明(27 ) 可有利地增加處理速度。 圖19與20顯示一裝置與一程序之實施例,用來根據上 述壓縮裝置與程序將被壓縮之資料解壓縮。 圖19顯示採用該動態與靜態字典之資料解壓縮裝置的 ,結構。此實施例結合圖2之壓縮器2 0 0加以組構。根據該實 施例之一特點,通常使用靜態字典241與該壓縮器200之產 生機構242。 一資料解壓縮裝置1900接收該輸入資料205,以便將 該資料解壓縮成資料量小於該輸入資料2G5之被解壓縮資 料。如同該資料壓縮器2QQ—般,該資料解壓縮器1900包 含此種用來作爲一資料處理設施之一電腦,例如一個人電 腦。可選擇地,該解壓縮器1900可由一連接於一電腦與一 網路之間的專用裝置加以實行。該資料解壓縮器1 900包含 —動態字典控制器1 930、一靜態字典控制器1 940、以及一 用來監督該系統之整體處理的控制器1920。該控制器1920 包含在一作業系統(OS)控制之下操作之一電腦的中央處理 單元(CPU)。再者,該控制器1 920控制用來接收將被解壓 縮之輸入資料的機構1921,以及用來輸出被解壓縮資料之 機構1951。 該動態字典控制器193G包含一動態字典1931、產生機 構1932、檢取機構1933與暫存機構1934。該動態字典1931 包含用來將位元串列與其索引儲存於其中之一資料庫,並 且被組構於一電腦之一儲存器中,例如,在併入該電腦之 一硬式磁碟上。該產生機構1932、檢取機構1933與暫存機 ---------^-- (請先閲讀背面之注意事項再填寫本頁) 訂 線 本紙張尺度適用中國國家梯準(CNS ) A4規格(210X:297公釐) 83. 3.10,000 -30 - 經濟部中央揉準局員工消费合作社印裝 312771 atB7五、發明説明(28 ) 構1 9 34則由掌管該動態字典1931之程式加以實行》 這些程式被儲存在該電腦中之一硬式磁碟上,並且在 該電腦啓動時被移動至主儲存器中•然後這些程式由該中 央處理單元執行,以完成預定的功能》 該靜態字典控制器1940包含一靜態字典241、產生機 構242、檢取機構1943與暫存機構1944。該靜態字典241包 含位元串列與其索引被儲存於其中之一資料庫。該字典 241被建構於一電腦之一儲存器中,例如,在併入該電腦 之一硬式磁碟上。該產生機構242、檢取機構194 3與暫存 機構1944則由掌管該靜態字典1941之程式加以實現。 這些程式被儲存在該電腦中之一硬式磁碟上,並且在 該電腦被啓動時移動至主儲存器中。然後這些程式由該中 央處理單元執行,以完成個別的功能。 該輸入機構1921與輸出機構1951,由對該電腦此一整 合式儲存器(例如一硬式磁碟)、經由一網路之一遠端檔案 系統、及/或一外部儲存器(例如一軟式磁碟或一磁帶)分 別完成資料輸入與輸出操作之程式(裝置驅動器)加以實現 。在此種組態中,被壓縮資料205被輸入至該系統。 該輸入機構1921接收該輸入資料205,然後將該資料 轉換成一輸入位元串列1902,以便由其輸出該串列1902。 該輸出機構1951由與該輸入位元串列1902結合之動態或靜 態字典1931或241接收一輸出位元串列1903,以便由其輸 出被解壓縮資料1905。 圖20爲一顯示於圖19中的解壓縮器之一程序的流程圖 ----^------1------1------# (請先W讀背面之注$項再填寫本頁) 本紙張尺度逋用中國國家標準(CNS ) A4規格(210X297公釐) 83. 3.10,000 -31 - 經濟部中央梂準局WC工消费合作社印製 A7 __B7_ 五、發明説明(29 ) ,其中藉著參照該靜態與動態字典241與1931之索引,將 該被_縮資料解壓縮。 該決策機構1943接收該輸入位元串列1902,並且經由 該參考機構244參考該靜態字典241。當該輸入位元串列 1902出現在該靜態字典241中時(步驟2001),該系統參考 使用該輸入位元串列1 902之靜態字典241,以獲得其一索 引以及與其結合之一位元串列(步驟2002 ),藉以輸出該位 元串列(步驟2003)。 在步驟2001中,當在該靜態字典241中不存在適切的 索引時,藉由該檢取機構1933執行通過該動態字典1931之 一捜尋(步驟2011)。當在該動態字典1931中發現該位元串 列時,該系統參考使用該輸入位元串列1 902之動態字典 1931,以獲得其一索引以及與其結合之一位元串列(步驟 2012),藉以輸出該位元串列(步驟2013)·此外,先前獲 得之輸出位元串列與在目前的過程中獲得者加以組合,例 如,包含先前輸出之一位元組的第一位元串列與目前輸出 者加以組合,以便將合成之位元串列暫存至該動態字典 1931(步驟 2014)。 就此而言,在步驟2011中,當該輸入字串1902不存在 於該動態字典1931中時,該輸入字串1902則被視爲錯誤的 ,而該過程以一錯誤過程之訊息加以終止(步驟2050)。 在上述的範例中,實際地實施通過該靜態與動態字典 之串列檢取,藉以決定是否於其中發現該輸入位元串列 1 9 02。該輸入位元串列1 9 02以一種大致相等於該輸出位元 本紙張尺度適用中國國家揉準(CNS > A4规格(210X297公釐) 83.3.10,000 -32 - ------1 裝 訂ir (請先閲讀背面之注意事項再填寫本茛) 經濟部中央梯準局貝工消费合作社印装 A7 B7 五、發明説明(30 ) 串列2 0 3與索引2 0 4之資料佈局而加以組構。結果,當索引 2 04之k用範圍事先分別被設定至該靜態字典(例如,〇至 1023)與該動態字典(例如,1024及以上)時,將可察覺到 該決策過程可以一較高的速度完成,而不必實施該字典檢 '取。 一電腦系統或一個人電腦系統之一資料處理裝置,通 常包含上述之資料壓縮器200與資料解壓縮器1900。所獲 得之資料經由該資料壓縮器200,被儲存至併入該裝置之 一硬式磁碟上。當使用該被儲存資料時,該被壓縮資料由 該硬式磁碟讀取,將由該被解壓縮之資料加以解壓縮成用 於個別使用目的之原始資料。附帶地,在此種情況下,該 靜態字典241可於該資料壓縮器與解壓縮器200與1900之間 共享。該動態字典亦可視情況而定而於其間共享。再者, 當資料處理裝置彼此經由一網路連接以傳送其間之資料時 ,由第一資料處理裝置之資料壓縮器200所壓縮的資料被 轉移至第二資料處理裝置》所接收之資料由該第二資料處 理裝置之資料解壓縮器1900加以解壓縮,將被處理於其中 〇 圖17顯示本發明之一實施例,其中該靜態字典無法於 該分散式系統中的裝置之間共享。該資料;壓縮器200使用 該動態字典231或該靜態字典241將資料壓縮,而該資料編 碼器260使用該動態字典260或該靜態字典261將資料編碼 。該壓縮器200大致與顯示於圖2中之資料壓縮器200相同 。亦即,該壓縮器2GQ接收一句子201,並且將該句子201 本紙張尺度逍用中國國家橾率(CNS ) A4規格(210X297公釐) 83.3.10,000 — —— — —————— 裝— I I I 11 訂.if (請先閱讀背面之注意Ϋ項再填寫本頁) -33 - 經濟部中央橾準局—工消费合作社印装 312771 B7 五、發明説明(31 ) 壓縮成被壓縮資料。該解碼器260完成與該壓縮器200相反 之一資料轉換。亦即,該解碼器260接收該被壓縮資料, 並且將該資料解碼成一句子201。該資料壓縮器200與連接 至經由一網路與資料轉移機構271連合之資料轉移機構270 ,的編碼機構252連結。該轉移機構271與連接至該資料解碼 器260的解碼機構253連結。再者,該編碼機構25 2包含一 靜態字典碼轉換表250,而該解碼機構253包含一靜態字典 碼轉換表251。假設包含文字"computer"與"this"之句子 資料201被輸入至該系統,並且使用該靜態字典241加以壓 縮。藉由該資料壓縮器200,文字” computer"與"this"分 別被變換爲將被傳送至該編碼機構2 5 2作爲被壓縮資料之 一部分的索引”251"與" 357"。接收這些資料項目,該編碼 機構252參考該碼轉換表250,以便將該項目轉換成一般索 引"2 0 4 7 "與"1 0 2 3 "。然後,包含一般索引"2 0 4 7,,與"1 0 2 3 ·, 之合成的被壓縮資料項目,經由該資料轉移機構270、網 路以及資料轉移機構271,被傳送至該解碼機構253。在接 收該資料項目時,該解碼機構253參考該碼轉換表251,以 便將該一般索引"2 G 4 7 "與"1 0 2 3 "分別變換爲對該靜態字典 .2 6 2獨特之索引"3 4 "與"1 4 3 "。包含索引11 3 4 "與"1 4 3 "之被 壓縮資料,被傳輸至該資料解碼器260。該解碼器260接收 該被壓縮資料,然後參考該靜態字典26 2,以便將該索引" 34"與”143”分別轉換成"computer"與"this",藉以產生包 含這些文字的原始句子201。 根據該實施例,該編碼機構252與解碼機構253分別設 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐〉 83. 3.10,000 ---------w-- (請先閲讀背面之注意事項再填寫本頁) r
T -34 - 經濟部中夬標率局貝工消費合作社印製 A7 B7 五、發明说明) 有靜態字典碼轉換表250與251,以便將該靜態字典241與 262之索引變換爲一般索引,使得一標準碼格式被界定於 該資料轉移區段中。由於此種設置,彼此具有不同構造的 資料壓縮器與解碼器之間的資料相容性得以確保。 在此種連接中,該編碼與解碼機構252與253於此實施 例中僅完成該索引碼轉換。然而,本發明並未受該實施例 之限制。可採用一種資料編碼與解碼操作可彼此組合之過 程。結果,提供一資料壓縮與編碼裝置,導致該被壓縮資 料可被傳輸通過該網路,並且確保資料安全之優點。根據 本發明,在基於該動態字典之資料壓縮方法中使用該靜態 字典,與只使用該動態字典之資料壓縮比較,資料壓縮比 可獲得改進。特別地,當該靜態字典被使用在無法使用該 動態字典有效率地完成資料壓縮之輸入資料的第一位置之 資料壓縮中時,該資料壓縮比大大地獲得改進。此外,當 區別該動態字典與該靜態字典之一碼被附加至被壓縮資料 之索引時,在解碼過程中的字典切換過程變得更容易。再 者’具有最短碼長度之一項目由該輸入位元串列之碼、該 靜態字典之索引、該動態字典之索引選出,使得該項目被 編碼成被壓縮資料,進一步地改進資料壓縮比。此外,只 有當該動態字典之索引小於用在該輸入位元串列之靜態字 典的索引時*該適切的輸入位元串列才被暫存至該動態字 典。此使得該動態字典的大小最小化。特別地,匹配該靜 態字典中一項目之一位元串列的一索引被輸出作爲被壓縮 資料,同時並未被附加地暫存至該動態字典。此減少該動 本紙張尺度適用中國國家標準(CNS ) A4規格(210X29*7公釐) 83. 3.10,000 I I I I I I I I — 裝^ ^ I I ^ 訂— — I I I (請先閲讀背面之注f項再填寫本頁) Α7 Β7 五、發明説明(33 ) 態字典大小與索引長度,導致資料壓縮比之改進。再者, 在將ίί入位元串列循序地暫存至該動態字典之一操作中, 當該動態字典之資料量到達一預定的資料量時,如果有必 要,另一輸入串列之暫存被禁止,及/或具有一低使用程 ,度或頻率之位元串列由該動態字典刪除。此有利地解決由 該動態字典之位元串列溢流的問題。 雖然本發明已參照特定的例示實施例加以描述,然而 其僅受到附隨之申請專利範圍的限制,而未受到這些實施 例的限制。只要不脫離本發明之範疇與精神,熟習該項技 藝者可改變或修正這些實施例。 ---------裝— (請先閲讀背面之注意事項再填寫本頁) -、?τ 線 經濟部中央梯率為及工消费合作社印装 83. 3.10,000 本紙張尺度逍用中國國家揉準(CNS ) Α4规格(210X297公釐) 36

Claims (1)

  1. ABCD 312771 六、申請專利範圍 1. 一種資料壓縮方法,其步驟包括: 將輸入資料分解成輸入位元串列; 對該輸入位元串列實施通過一第一字典之一串列檢取 ’該第一字典包含表格資料,該表格資料包含分別與索引 .〆 結合之位元串列,每一索引較該被結合之位元串列爲短; 根據該檢取之一結果,將該輸入位元串列暫存至該第 一字典; 將該輸入位元串列轉換成該輸入位元串列之一碼,或 是對應於該輸入位元串列的第一字典之一索引*藉以將所 獲得之碼或索引輸出爲被壓縮資料; 對該輸入位元串列實施通過一第二字典之一串列檢取 ,藉由以一固定的方式將位元串列預先界定爲輸入候選者 與其索引,將該第二字典加以組構; 將該輸入位元串列與該第二字典中之一位元串列加以 比較;以及 根據該比較之一結果,將該輸入位元串列暫存至該第 一字典。 2. —種資料壓縮裝置,其中輸入資料被分解成輸入 位元串列,以便對該輸入位元串列實施通過一第一字典之 一串列檢取,該第一字典包含表格資料,該表格資料包含 分別與索引結合之位元串列,每一索引較該被結合之位元 串列爲短,根據該檢取之一結果,該輸入位元串列被暫存 至該第一字典,而該輸入位元串列被轉換成該輸入位元串 列之一碼,或是對應於該輸入位元串列的第一字典之一索 本紙張尺度適用中國國家標準(CNS ) A4规格(210X297公釐) ---------1--------1T---------0 (請先閱讀背面之注$項再填寫本頁) 鯉濟部中央橾率局負工消费合作社印製. -37 - A8 E8 C8 D8 經濟部中央橾準局Μζ工消費合作社印製 六、申請專利範圍 引’所獲得之碼或索引被輸出作爲被壓縮資料,包括·· 一第二字典,其係藉由以一固定的方式將位元串列預 先界定爲輸入候選者與其索引而加以組構; 用來產生該第二字典之機構: 用來參考該第二字典之內容的機構;以及 決策機構,用來決定是否一位元串列需要被暫存至該 第一字典,藉以根據得自該決策機構之一結果,將該位元 串列暫存至該第一字典。 3. —種資料壓縮方法,其步驟包括: 將輸入資料分解成輸入位元串列; 對該輸入位元串列實施通過一第一字典之一串列檢取 ’該第一字典包含表格資料,該表格資料包含分別與索引 結合之位元串列,每一索引較該被結合之位元串列爲短; 根據該檢取之一結果,將該輸入位元串列暫存至該第 一字典; 將該輸入位元串列轉換成該輸入位元串列之一碼,或 是對應於該輸入位元串列的第一字典之一索引,藉以將所 獲得之碼或索引輸出爲被壓縮資料;其中 該輸出被壓縮資料之步驟,輸出包含該輸入位元串列 之碼、該第一字典之索引、以及藉由以一固定的方式將位 元串列預先界定爲輸入候選者與其索引而加以組構之一第 二字典的一索引之碼中的任何一者,並且輸出指定將被用 來作爲用於一解碼操作之一字典的第一或第二字典之一碼 (請先閱讀背面之注意事項再填寫本頁) -裝· 訂 本紙張尺度適用中國國家橾率(CNS )八4規格(210X297公釐) -38 - 經濟部中央糅準局貝工消费合作社印輦 C8 D8 々、申請專利範圍 4. 一種資料壓縮方法,其步驟包括: 將輸入資料分解成輸入位元串列: 對該輸入位元串列實施通過一第一字典之一串列檢取 ,該第一字典包含表格資料,該表格資料包含分別與索引 結合之位元串列,每一索引較該被結合之位元串列爲短; 根據該檢取之一結果,將該輸入位元串列暫存至該第 一字典; 將該輸入位元串列轉換成該輸入位元串列之一碼,或 是對應於該輸入位元串列的第一字典之一索引,藉以將所 獲得之碼或索引輸出爲被壓縮資料; 儲存該輸入位元串列的碼之一長度; 儲存一對應於一位元串列匹配該輸入位元串列之第一 字典,以及藉由以一固定的方式將位元串列預先界定爲輸 入候選者與其索引而加以組構之第二字典的至少任何一者 之一索引的長度,其中 該輸出被壓縮資料之步驟,輸出包含該輸入位元串列 與該索引之碼的任何一者,該碼具有一較小的長度。 5.根據申請專利範圍第3項之資料壓縮方法,進一步 包含之步驟爲當匹配該輸入位元串列之一位元串列由該第 二字典檢取時,輸出該第二字典之索引作爲該被壓縮資料 〇 6_根據申請專利範圍第3項之資料壓縮方法,進一步 包含之步驟爲: 記下位元之門限值數目,用來啓始該第一字典之索引 本紙張尺度逍用中國國家橾率(CNS ) A4規格(2丨0X297公釐) ---------1------ΐτ------Μ (請先閲讀背面之注意事項再填寫本頁) -39 - 經濟部中央標準局負工消費合作社印製 Α8 Β8 C8 D8 π、申請專利範圍 的輸出; 根據該輸入位元串列的位元數目與輸入的_數貝其中至 少任何一者,計算被處理之位元的數目,直到一目前的時 間點;以及 當被處理之位元的數目超過該位元之門限值時’輸出 該第一字典之索引作爲該被壓縮資料。 7. 根據申請專利範圍第1項之資料壓縮方法’進一步 包含之步驟爲當匹配該輸入位元串列之一位元串列在該第 二字典中被偵測到時,跳過該輸入位元串列至該第一字典 的暫存。 8. 根據申請專利範圍第1項之資料壓縮方法*其中: 將該輸入位元串列與該第二字典之一位元串列比較的 步驟,記下一匹配該第二字典中的輸入位元串列之一第一 索引的長度:以及 將該輸入位元串列暫存至該第一字典的步驟,結合至 該第一字典的暫存計算一第二索引之一長度,並且當該第 二索引較該第一索引短時,將該第二索引暫存至該第一字 典β 9. 根據申請專利範圍第2項之資料壓縮裝置,其中該 第二字典包含由例如英文或日文之一自然語言的至少一文 字或其一部分、一程式語言的至少一保留字或其一部分、 以及一機器語言的至少一指令或其一部分所選擇之至少一 種字串, 該字典包含由該字串之屬性資訊、其一出現機率、以 本紙張尺度適用中國國家標率(CNS ) Α4規格(210Χ297公釐) (請先閲讀背面之注意事項再填寫本頁) ' -40 - 經濟部中央梯準局員工消费合作社印製 A8 B8 C8 D8 #、申請專利範圍 及該字串之間的關係所選擇之至少一種附加資訊。 10.根據申請專利範圍第9項之資料壓縮裝置,其中: 該第二字典包含一自然語言之一字串,或者在一自然語言 之一規則表示法中之一字串; 該屬性資訊界定語音部分、文字變化、文字意義;以 及 該字串之間的關係界定文字的表示法或用法。 Π.根據申請專利範圍第1項之資料壓縮方法,其中: 在資料被輸入之前界定該位元串列作爲輸入候選者與 其索引以產生該第二字典之步驟,結合該位元串列與索引 ’界定了由該位元串列之屬性資訊、其出現機率、以及該 位元串列之間的關係所選擇之至少一種附加資訊; 將該輸入位元串列與該第二字典之一位元串列比較的 步驟,記下該輸入位元串列之附加資訊;以及 將該輸入位元暫存至該第一字典的步驟,根據該第二 I 字典之附加資訊,跳過該輸入位元串列之暫存。 12.根據申請專利範圍第1項之資料壓縮方法,其中 在資料被輸入之前界定該位元串列作爲輸入候選者與 其索引以產生該第二字典之步驟,結合該位元串列與索引 ’界定了由該位元串列之屬性資訊、其出現機率、以及該 位元串列之間的關係所選擇之至少一種附加資訊; 將該輸入位元串列與該第二字典之一位元串列比較的 步驟,記下該輸入位元串列之附加資訊;以及 將該輸入位元暫存至該第一字典的步驟,根據該第二 本紙張尺度適用中國國家標準(CNS ) A4规格(210X297公釐) —^1 ^^1 In 1^1 In ί — n^i *1 (請先M讀背面之注意事項再填寫本頁) -訂- 經濟部中央標準局男工消费合作社印製 A8 B8 C8 D8 _ 六、申請專利範圍 字典之附加資訊,刪除至少一位元串列。 13. 根據申請專利範圍第2項之資料壓縮裝置’其中 該第二字典包含由該位元串列之屬性資訊、其出現機率、 以及該位元串列之間的關係所選擇之至少一種附加資訊’ 該裝置進一步包含: 至少一刪除機構,用來根據該第二字典之附加資訊’ 將被暫存之位元串列由該第一字典刪除;以及 檢取機構,用來記下由該第一字典一使用率大小之一 上限值與被暫存的位元串列數目之一上限值中所選擇的至 少一個,並且用來由該第一字典檢取該輸入位元串列, 該刪除機構執行用來偵測輸入位元串列之累積數目超 過該上限值之一事件的偵測機構,並且執行用來藉由參考 該第二字典之附加資訊由該第一字典刪除至少一位元串列 的刪除機構。 14. 根據申請專利範圍第2項之資料壓縮裝置,進一 步包含一初始化顯示幕,用來還擇爲了.產生該第二字典的 〆 產生機構之一程式、將該輸入位元串列暫存至該第一字典 之一程式、或者由該第一字典刪除被暫存的位元串列之一 程式,藉以設定用於資料壓縮之一條件。 15. 根據申請專利範圍第2項之資料壓縮裝置,其中: 該第一字典包含最多爲21°至2 15的索引;以及 該第二字典包含最多爲212至217的索引。 16. —種資料壓縮方法,其步驟包括: 將輸入資料分解成输入位元串列: 本紙張尺度適用中國國家標準(CNS > A4規格(210X297公釐) I ϋ I I n I 1· — 裝—— I I I i I I I 線 (請先閱讀背面之注意事項再填寫本頁) -42 - 312771 5? C8 D8 經濟部中央標準局貝工消費合作社印裝 i、申請專利範圍 產生具有空白或預定的基本位元串列之一第一字典; 由該第一字典檢取該輸入位元串列; 將該輸入位元串列暫存军該、第一字典; 將該輸入位元串列與該第一字典之一位元串列的至少 任何一者編碼,並且輸出該編碼之一結果作爲被壓縮資料 > 在資料被輸入之前,界定位元串列作爲輸入候選者與 其索引,並且藉以產生一第二字典;以及 確認其內容大致與該第二字典的內容相等之一字典的 存在,並且輸出該第一與第二字典之索引。 17. —種使用在一分散式系統中之一資料壓縮裝置, 該分散式系統包含至少一資料壓縮裝置與至少一資料解碼 裝置, 該資料壓縮裝置使用根據輸入資料與預先界定之一第 二字典將位元串列暫存至該處之一第一字典壓縮資料, 該資料解碼裝置使用該第一字典以及與該第二字典完 全或部分不同之一第三字典將.資料解碼, 該資料壓縮裝置包含: 編碼機構,用來將資料轉換成一種與該第二字典無關 之一般索引;以及 資料轉移機構,用來由該處傳輸該一般索引, 該資料解碼裝置包含: 資料轉移機構,用來接收該一般索引;.以及 解碼機構,用來將該一般索引變換爲該第三字典之一 (請先閲讀背*之注$項再填窝本頁) .裝· 訂 錄 本紙張纽邮tilB5家梯率(CNS ) A4規格(210X297公釐) —43 - 經濟部中央標率局負工消费合作社印製 A8 B8 C8 ._ D8 ___ 六、申請專利範圍 索引。 18. —種將包含一第一位元串列的資料壓縮且轉換成 .一第二位元串列之資料壓縮方法,該第二位元串列之長度 小於該第一位元串列,其步驟包括: 根據一預定的法則,將包含一第一位元串列之資料轉 換成一第—位兀串列’該第二位元串列具有一較該第一位 元串列小的長度; 根據一表格,其中每一候選輸入資料之一位元串列事 先固定地對應於長度小於該候選輸入資料的位元串列之一 位元串列,將資料轉換成長度較該第二位元串列小之一第 三位元串列; 將該第二位元串列與該第三位元串列加以比較; 決定長度較小的位元串列之一作爲一比較之結果,並 且輸出該位元串列作爲一經過壓縮與轉換之位元串列。 .· ·! 19. 根據申請專利範圍第18項之資料壓縮方法,進一 步包含之步驟爲當比較之結果爲該位元串列彼此大致相等 時,輸出一預定的轉換結果之·一作爲一經過壓縮與轉換之 位元串列。 20. —種將經過壓縮與轉換之資料解壓縮成原始資料 的解壓縮方法,其中包含一第一位元串列之原始資料被轉 換成一第二位元串列,該第二位元串列之長度小於該第一 位元串列,並且根據一表格,其中每一候選輸入資料之一 位元串列事先固定地對應於長度小於該候選輸入資料的位 元串列之一位元串列,將該原始資料轉換成長度小於該第 本紙張纽適用中國困家梯率(CNS)从胁(21()χ29ϋ ~ -44 - (請先閲t»背面之注$項再填寫本頁) :參. 訂 A8 B8 C8 D8 經濟部中央揉率局負工消费合作社印«. ☆、申請專利範圍 二位元串列之一第三位元串列,藉以將該原始資料轉換成 經過壓縮與轉換之資料,其步驟包括: 將根據該預定的法則壓縮與轉換所獲得之位元串列的 一部分位元串列,根據一預定的解壓縮法則,解壓縮與轉 換成該原始資料之一位元串列;以及 將根據該表格轉換之被壓縮且協同的位元、串列,根據 —表格,其中每一候選被壓縮串列固定地對應於該原始輸 入資料之位元串列,解壓縮與轉換成該原始輸入資料之一 位元串列。 2 1.根據申請專利範圍第2G項之資料解壓縮方法,其 中: 使用在壓縮與轉換中之表格,以及使用在解壓縮與轉 換中之表格,具有一種類似的佈局, 被使用在壓縮與轉換中之表格,用來獲得與該候選輸 入資料的位元串列有關之一短的位元串列, 被使用在解壓縮與轉換中之表格,用來獲得該原始輸 入資料之位元串列,作爲與被壓縮之短的位元串列有關之 候選者。 22. 根據申請專利範圍第20項之資料解壓縮方法,其 中使用在壓縮與轉換中之表格,以及使用在解壓縮與轉換 中之表格,爲一原始表格之複製。 23. —種資料壓縮裝置,包括·’ 一第一資料壓縮區段,用來根據一預定的法則,將包 含一第一位元串列之輸入資料轉換成一第二位元串列,該 (請先S讀背面之注$項再填寫本頁) ^. 訂 锊 本紙張尺度遑用中國國家梯率(CNS > A4規格(210X297公釐) -45 - 312771 Α8 Β8 C8 D8 鯉濟部中夬標準局真工消费合作社印製 六、申請專利範圍 第二位元串列具有一較該第一位元串列小的長度; 一第二資料壓縮區段,用來根據一表格,其中每一候 .選輸入資料之一位元串列事先固定地對應於長度小於該候 選輸入資料的位元串列之一位元串列,將該輸入資料轉換 成長度較該第二位元串列小之一第三位元串列;以及 一壓縮控制區段,用來藉由該第一與第二資料壓縮區 段,將該輸入資料轉換成長度小於該輸入資料的位元串列 之一位元串列。 24. 根據申請專利範圍第23項之資料壓縮裝置,其中 該壓縮控制區段將由該第一資料壓縮區段所轉換之位元串 列與由該第二資料壓縮區段所轉換者相比較,並且輸出具 有一較小長度的位元串列之一。 25. —種資料解壓縮裝置,用來將經過壓縮與轉換之 資料,解壓縮成藉由一第一資料壓縮區段與一第二資料壓 縮區段壓縮與轉換之原始資料,該第一資料壓縮區段將包 含一第一位元串列之輸入資料,轉換成長度小於該第一位 元串列之一第二位元串列,該.第二資料壓縮區段根據一表 格,其中每一候選輸入資料之一位元串列事先固定地對應 於長度小於該候選輸入資料的位元串列之一位元串列,將 該輸入資料之位元串列轉換成長度小於該第二位元串列之 一第三位元串列,包括: 一第一資料解壓縮區段,用來根據一預定的法則,將 經過壓縮與轉換之位元串列,解壓縮與轉換成該原始輸入 資料之位元串列; 本^張尺度適用中國β家標準(CNS > A4規格(210X297公釐) (請先閲讀背面之注意事項再填寫本頁) -46 - 經濟部中央標準局負工消费合作社印製· A8 B8 C8 D8 六、申請專利範圍 一第二資料解壓縮區段,用來根據一表格,其中作爲 一輸入候選者之經過壓縮與轉換的位元串列事先固定地對 應於該原始輸入資料之位元串列,將經過壓縮與轉換之位 元串列解壓縮成該原始輸入資料之位元串列;以及 一解壓縮控制區段,用來根據該第一與第二資料壓縮 區段’將經過壓縮與轉換之位元串列解壓縮成該原始輸入 資料之位元串列。 26.根據申請專利範圍第25項之資料解壓縮裝置,其 中: 該第二資料壓縮區段之表格,以及該第二資料解壓縮 區段之表格,具有彼此互相類似的佈局, 該第二資料壓縮區段根據其表格,由作爲一輸入候選 者之輸入資料的位元串列獲得一短的位元串列;以及 該第二資料解壓縮區段根據其表格,由經過壓縮之短 的串列獲得作爲該輸入候選者之原始輸入資料的位元串列 〇 2 7.根據申請專利範圍第25項之資料解壓縮裝置,其 中該第二資料壓縮區段之表格大致與該第二資料解壓縮區 段之表格相同。 28.—種資料處理裝置,包括: 一輸入區段,用來接收資料作爲一輸入; —第一資料壓縮區段,用來根據一預定的法則,將得 自包含一第一位元串列之輸入區段的輸入資料,轉換成一 第二位元串列,該第二位元串列之長度小於該第一位元串 本紙張尺度通用中國固家梯準(CNS ) A4規格(210X297公釐) (請先閲讀背面之注意事項再填寫本頁) 1· 訂 -47 - 經濟部中央標準局貝工消费合作社印11. 312771 il C8 D8 __ 六、申請專利範圍 列; —第二資料壓縮區段,用來根據一表格,其中每一候 選輸入資料之一位元串列事先固定地對應於長度小於該候 選輸入資料的位元串列之一位元串列,將該輸入資料轉換 成長度小於該第二位元串列之一第三位元串列; —壓縮控制區段,用來藉由該第一與第二資料壓縮區 段’將該输入資料轉換成長度小於該输入資料的位元串列 之一位元串列;以及 —輸出區段,用來輸出由該壓縮控制區段所轉換之位 元串列。 29. 根據申請專利範圍第28項之資料壓縮裝置,其中 該壓縮控制器將由該第一資料壓縮區段所換之位元串列 與由該第二資料壓縮區段所轉換者加以比較,並且輸出具 有一較小長度的位元串列之一。 30. —種資料處理裝置,接收由一第一資料壓縮區段 與一第二資料壓縮區段壓縮與轉換之資料作爲一輸入,該 第一資料壓縮區段將包含一第一位元串列之輸入資料,轉 換成長度小於該第一位元串列之一第二位元串列,該第二 資料壓縮區段根據一表格,其中每一候選輸入資料之一位 元串列事先固定地對應於長度小於該候選輸入資料的位元 串列之一位元串列,將該輸入資料之位元串列轉換成長度 小於該第二位元串列之一第三位元串列,包括: 一第一資料解壓縮區段,用來根據一預定的法則,將 經過壓縮與轉換之位元串列,解壓縮與轉換成該原始輸入 本紙張尺度逋用中國困家標隼(CNS) M规格(210X297公釐) ^ n n n ^ n n I .1 n ^ (請先閲讀背面之注意事項再填寫本頁) -48 ~ 經濟部中央梯準局負工消费合作社印製 A8 B8 C8 D8 _六、申請專利範圍 資料之位元串列; 一第二資料解壓縮區段,用來根據一表格,其中作爲 一輸入候選者之經過壓縮與轉換的位元串列事先固定地對 應於該原始輸入資料之位元串列,將經過壓縮與轉換之位 元串列解壓縮成該原始輸入資料之位元串列;以及 一解壓縮控制區段,用來根據該第一與第二資料壓縮 區段,將經過壓縮與轉換之位元串列解壓縮成該原始輸入 資料之位元串列。 31. 根據申請專利範圍第30項之資料處理裝置,其中 該第二資料壓縮區段之表格,以及該第二資料解壓縮 區段之表格,具有彼此互相類似的佈局, 該第二資料壓縮區段根據其表格,由作爲一輸入候選 者之輸入資料的位元串列獲得一短的位元串列;以及 該第二資料解壓縮區段根據其表格,由經過壓縮之短 的串列獲得作爲該輸入候選者之原始輸入資料的位元串列 〇 32. —種資料處理裝置,包括: —輸入區段,用來接收資料作爲一輸入; 一過程控制區段,根據一預定的法則,將得自包含一 第一位元串列之輸入區段的輸入資料,轉換成一第二位元 串列,該第二位元串列之長度小於該第—位元串列;根據 一表格,其中每一候選輸入資料之一位元串列事先固定地 對應於長度小於該候選輸入資料的位元串列之一位元串列 本紙張尺度適用中國固家梯準(CNS ) A4規格(210 X 297公釐) (請先閲讀背面之注意事項再填寫本頁) 訂 A8 B8 C8 D8 312771 六、申請專利乾圍 ,將該输入資料轉換成長度小於該第二位元串列之一第三 位元串列,將被轉換之位元串列互相比較,並且由其輸出 具有一較小長度的位元串列之一;以及 一输出區段,用來輸出由該壓縮控制區段所轉換之位 元串列。 33. —種資料處理裝置,包括: 一輸入區段,用來接收資料作爲一輸入; 一表格,其中每一候選輸入資料之一位元串列固定地 對應於長度小於該候選輸入資料的位元串列之一位元串列 I 一過程控制區段,根據一預定的法則,將得自包含一 第一位元串列之輸入區段的輸入資料,轉換成一第二位元 串列,該第二位元串列之長度小於該第一位元串列;根據 一表格,其中每一候選輸入資料之一位元串列事先固定地 對應於長度小於該候選輸入資料的位元串列之一位元串列 ,將該輸入資料轉換成長度小於該第二位元串列之一第三 位元串列,將被轉換之位元串列互相比較,並且由其輸出 具有一較小長度的位元串列之一;以及 一輸出區段,用來輸出由該壓縮控制區段所轉換之位 元串列。 34. —種資料處理裝置,包括: 一第一表格,其中每一轉換候選輸入資料之一位元串 列’事先固定地對應於長度小於該候選輸入資料的位元串 列之一位元串列; 本紙张尺度適用中國囷家梯率(CNS ) A4規格(210 X 297公釐〉 (請先閲讀背面之注$項再填寫本頁) ^· 經濟部中央揉準局負工消费合作社印掣 -50 - A8 B8 C8 D8 經濟部中央揉準局工消费合作社印裝 六、申請專利範圍 一資料壓縮區段,根據一預定的法則,將包含一第一 位元串列之資料轉換成一第二位元串列,該第二位元串列 之長度小於該第一位元串列;根據該表格,將該資料之位 元串列轉換成長度小於該第二位元串列之一第三位元串列 ,將被轉換之位元串列互相比較,並且由其輸出具有一較 小長度的位元串列之一作爲一經過壓縮與轉換之位元串列 t 一第二表格,其中每一經過壓縮與轉換之位元串列, 事先固定地對應於該原始資料之位元串列;以及 一資料解壓縮區段,根據一預定的法則,將經過壓縮 與轉換之位元串列解壓縮與轉換成該原始資料之位元串列 ,並且根據該表格,將經過壓縮與轉換之位元串列轉換成 該原始資料之位元串列。 3 5.根據申請專利範圍第34項之資料解壓縮裝置,其 中: 該第一與第二表格彼此大致相同; 該資料壓縮區段根據其表格,由作爲一输入候選者之 輸入資料的位元串列獲得一短的位元串列;以及 該資料解壓縮區段根據其表格,由經過壓縮之短的串 列獲得作爲該輸入候選者之原始輸入資料的位元串列。 36.—種網路系統,其中多個資料處理裝置彼此互相 連接,以便用於經由網路傳輸路徑之資料通訊,其中·· 由該多個資料處理裝置所選擇之第一資料處理裝置包 含: (請先閱讀背面之注意事項再填寫本頁) 訂' 本紙張尺度逋用中国國家梯率(CNS ) A4规格(210X297公釐) -51 - 312771 A8 B8 C8 D8 經濟部中央揉準局貝工消费合作社印«. A、申請專利範圍 一表格,其中每一候選輸入資料之一位元串列,事先 固定地對應於長度小於該候選輸入資料的位元串列之一位 .元串列; —過程控制區段,根據一預定的法則,將包含一第一 位元串列之轉移資料轉換成一第二位元串列,該第二位元 串列之長度小於該第一位元串列;根據該表格,將該轉移 資料之位元串列轉換成長度小於該第二位元串列之一第三 位元串列,將被轉換之位元串列互相比較,並,且由其輸出 具有一較小長度的位元串列之一作爲一經過壓縮與轉換之 位元串列; 一資料轉移區段,用來將經過壓縮與轉換之位元串列 ’由該過程控制區段傳輸至骸網路作爲轉移資料:以及 由該多個資料處理裝置隨意地選擇之第二資料處理裝 置包含: 一資料接收區段,用來由該資料轉移區段接收經過壓 縮之資料; 一表格’其中每一經過壓·縮與轉換之位元串列,事先 固定地對應於該原始資料之位元串列;以及 一過程控制區段,根據一預定的法則,將經由該網路 接收之經過壓縮與轉換的位兀串列,解壓縮與轉換成該原 始資料之位元串列,並且根據該表格,將經過壓縮與轉換 之位元串列解壓縮與轉換成該原始資料之位元串列。 37.根據申請專利範圍第36項之網路系統,其中: 該多個資料處理裝置之第一與第二資料處理裝置個別 (婧先Μ讀背面之注$項存填寫本育) -装' 訂 線 本紙張尺度逋用中國國家標率(CNS ) A4规格(210X297公釐) 經濟部中央梂率局員工消费合作社印装 A8 B8 C8 D8 六、申請專利範圍 的表格’其佈局大致彼此相同; 該多個資料處理裝置之第一資料處理裝置根據其表格 由作爲一輸入候選者之輸入資料的位元串列獲得一短的 位元串列;以及 該多個資料處理裝置之第二資料處理裝置根據其表格 ’由經過壓縮之短的串列獲得作爲該輸入候選者之原始輸 入資料的位元串列。 3 8.根據申請專利範圍第36項之網路系統,其中該多 個資料處理裝置之第一與第二資料處理裝置個別的表格, 爲一原始表格之複製。 39. 根據申請專利範圍第36項之網路系統,其中: 該多個資料處理裝置包含至少一伺服器;以及 其他的資料處理裝置由該伺服器複製表格,並且將該 複製之表格儲存於其中。 40. 根據申請專利範圍第36項之網路系統,其中將由 該資料轉移區段轉移至該網路的經過壓縮與轉換之資料, 以一種密碼的系統加以表示。. 41. 一種網路系統,其中多個資料處理裝置彼此互相 連接,以便用於經由網路傳輸路徑之資料通訊,其中: 由該多個用於其間之資料通訊的資料處理裝置所選擇 之至少兩個資料處理裝置的每一個包含: 一表格,其中每一轉換候選輸入資料之一位元串列, 事先固定地對應於長度小於該轉換候選輸入資料的位元串 列之一位元串列; 本紙張尺度適用中國國家糂準(CNS >M规格(210x297公廉) 11 I I^—訂 I I 111 I 絲 (請先閲讀背面之注意事項再填寫本頁) -53 - 經濟部中失標率局員工消费合作社印装 A8 B8 C8 D8六、申請專利範圍 一第一過程控制區段,根據一預定的法則,將包含一 第一位元串列之轉移資料轉換成一第二位元串列,該第二 位元串列之長度小於該第一位元串列;根據該表格,將該 轉移資料之位元串列轉換成長度小於該第二位元串列之一 第三位元串列,根據被轉換之位元串列的一種組合壓縮與 轉換該轉移資料,並且由其輸出所轉換之資料; 一資料轉移區段,用來將經過壓縮與轉換之位元串列 ,由該第一過程控制區段傳輸至該網路作爲轉移資料;以 及 一資料接收區段,用來由該資料處理裝置之一通訊中 的資料處理裝置,經由該網路接收經過壓縮之資料:以及 一第二過程控制區段,根據一預定的法則,將經由該 資料接收區段接收之經過壓縮與轉換的位元串列,解壓縮 與轉換成該原始資料之位元串列,並且根據該表格,將經 過壓縮與轉換之位元串列解壓縮與轉換成該原始資料之位 元串列。 42. —種儲存媒體,將一 ·程式儲存於其中,該程式用 來將包含一第一位元串列之資料轉換成一第二位元串列, 該第二位元串列之長度小於該第一位元串列*其中該程式 包含: 根據一預定的法則,將包含一第一位元串列之資料轉 換成一第二位元串列,該第二位元串列之長度小於該第一 位元串列,並且根據一表格,其中每一候選輸.入資料之一 位元串列事先固定地對應於長度小於該候選輸入資料的位 本紙張尺度逋用中國鬮家橾準(CNS > A4规格(210X297公釐) II I I 裝 — — — — — — 訂 I I 絲 (請先閲讀背面之注$項再填寫本頁) -54 - 趣济部中央棣準局Λ工消势合作社印製 A8 B8 C8 D8 _六、申請專利範圍 元串列之一位元串列,將該候選輸入資料之位元串列轉換 成長度小於該第二位元串列之一第三位元串列; 將被轉·換之位元串列互相比較;以及 根據比較之結果,由其輸出具有一較小長度的位元串 列之一作爲一經過壓縮與轉換之位元串列。 43. 根據申請專利範圍第42項之儲存媒體,其中當被 轉換之位元串列彼此大致相等時,一預定的轉換結果被輸 出作爲經過壓縮與轉換之位元串列。 44. 一種儲存媒體,將一程式儲存於其中,該程式根 據一預定的法則,將包含一第一位元串列之資料轉換成一 第二位元串列,該第二位元串列之長度小於該第一位元串 列,並且根據一表格,其中每一候選輸入資料之一位元串 列事先固定地對應於長度小於該候選輸入資料的位元串列 之一位元串列,將該候選輸入資料之位元串列轉換成長度 小於該第二位元串列之一第三位元串列,並且根據被轉換 之位元串列的一種組合,將經過壓縮與轉換之資料解壓縮 與轉換成該原始資料,該程式包括: 將經過壓縮與轉換之位元串列的一部分位元串列加以 解壓縮與轉換,該部分的位元串列根據該預定的法則加以 壓縮與轉換,藉以根據一預定的解壓縮法則,獲得該原始 資料之位元串列;以及 將經過壓縮與轉換之位元串列的一部分位元串列加以 解壓縮與轉換,該部分的位元串列根據該表格加以壓縮與 轉換,藉以根據一表格,其中作爲候選資料之每一經過壓 本紙張尺度適用中國國家橾準(CNS ) A4規格(210><297公釐) 312771 I I 裝—— 訂— 錄 (請先Μ讀背面之注意事項再填寫本頁) -55 - A8 B8 C8 D8 六、申請專利範圍 縮與轉換的位元串列事先固定地對應於該原始輸入資料的 位元•串列,獲得該原始輸入資料之位元串列。 45. —種資料之被壓縮資料佈局,該資料根據彼此部 分地不同之多個壓縮過程的一種組合加以壓縮,其中 該資料之每一部分包含一碼,該碼識別已處理該適切 的部分之多個過程之一,以及一位元串列,該位元串列由 該碼所識別之壓縮過程加以壓縮。 46. —種資料訊號,用來經由一網路傳輸資料,該資 料根據彼此部分地不同之多個壓縮過程的一種組合加以壓 縮,其中 該資料之每一部分包含一碼,該碼識別已處理該適切 的部分之多個過程之一,以及一位元串列,該位元串列由 該碼所識別之壓縮過程加以壓縮。 I I I I 1^-1 I I I I I 訂 I I I I 鍵 (請先聞讀背面之注意事項再填^本頁) 败濟部中夫橾率局貞工消费合作社印*. 本紙張尺度逍用中國國家標準(CNS ) A4規格(210X297公釐) -56 -
TW086100774A 1996-01-31 1997-01-24 TW312771B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP01501296A JP3277792B2 (ja) 1996-01-31 1996-01-31 データ圧縮方法および装置

Publications (1)

Publication Number Publication Date
TW312771B true TW312771B (zh) 1997-08-11

Family

ID=11876975

Family Applications (1)

Application Number Title Priority Date Filing Date
TW086100774A TW312771B (zh) 1996-01-31 1997-01-24

Country Status (9)

Country Link
US (1) US5872530A (zh)
EP (1) EP0788239A3 (zh)
JP (1) JP3277792B2 (zh)
KR (1) KR100271861B1 (zh)
CN (1) CN1205574C (zh)
AU (1) AU702207B2 (zh)
IN (1) IN190446B (zh)
SG (1) SG55271A1 (zh)
TW (1) TW312771B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012236970A (ja) * 2010-12-21 2012-12-06 Sumitomo Chemical Co Ltd 高分子化合物及びそれを用いた発光素子
US8721117B2 (en) 2007-08-31 2014-05-13 Lg Innotek Co., Ltd. Lighting device

Families Citing this family (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5951623A (en) * 1996-08-06 1999-09-14 Reynar; Jeffrey C. Lempel- Ziv data compression technique utilizing a dictionary pre-filled with frequent letter combinations, words and/or phrases
US6163780A (en) 1997-10-01 2000-12-19 Hewlett-Packard Company System and apparatus for condensing executable computer software code
JP2000165444A (ja) * 1998-11-30 2000-06-16 Nec Corp 光パケットスイッチ
US6624761B2 (en) * 1998-12-11 2003-09-23 Realtime Data, Llc Content independent data compression method and system
US6377930B1 (en) 1998-12-14 2002-04-23 Microsoft Corporation Variable to variable length entropy encoding
US6404931B1 (en) 1998-12-14 2002-06-11 Microsoft Corporation Code book construction for variable to variable length entropy encoding
US6279062B1 (en) * 1998-12-28 2001-08-21 Compaq Computer Corp. System for reducing data transmission between coprocessors in a video compression/decompression environment by determining logical data elements of non-zero value and retrieving subset of the logical data elements
US6604158B1 (en) * 1999-03-11 2003-08-05 Realtime Data, Llc System and methods for accelerated data storage and retrieval
US6601104B1 (en) 1999-03-11 2003-07-29 Realtime Data Llc System and methods for accelerated data storage and retrieval
US6904402B1 (en) * 1999-11-05 2005-06-07 Microsoft Corporation System and iterative method for lexicon, segmentation and language model joint optimization
JP3307909B2 (ja) * 2000-01-24 2002-07-29 ケンテックス株式会社 株価データの圧縮方法及び株価データの圧縮送信方法
US20030191876A1 (en) 2000-02-03 2003-10-09 Fallon James J. Data storewidth accelerator
US20010047473A1 (en) 2000-02-03 2001-11-29 Realtime Data, Llc Systems and methods for computer initialization
US7026962B1 (en) * 2000-07-27 2006-04-11 Motorola, Inc Text compression method and apparatus
US9143546B2 (en) 2000-10-03 2015-09-22 Realtime Data Llc System and method for data feed acceleration and encryption
US8692695B2 (en) * 2000-10-03 2014-04-08 Realtime Data, Llc Methods for encoding and decoding data
US7417568B2 (en) 2000-10-03 2008-08-26 Realtime Data Llc System and method for data feed acceleration and encryption
US7054953B1 (en) * 2000-11-07 2006-05-30 Ui Evolution, Inc. Method and apparatus for sending and receiving a data structure in a constituting element occurrence frequency based compressed form
US6985965B2 (en) * 2000-11-16 2006-01-10 Telefonaktiebolaget Lm Ericsson (Publ) Static information knowledge used with binary compression methods
TW543311B (en) * 2000-11-16 2003-07-21 Ericsson Telefon Ab L M Static information knowledge used with binary compression methods
US6883035B2 (en) * 2000-11-16 2005-04-19 Telefonaktiebolaget Lm Ericsson (Publ) System and method for communicating with temporary compression tables
US6606040B2 (en) * 2001-02-13 2003-08-12 Mosaid Technologies, Inc. Method and apparatus for adaptive data compression
US7386046B2 (en) 2001-02-13 2008-06-10 Realtime Data Llc Bandwidth sensitive data compression and decompression
US7382878B2 (en) * 2001-06-22 2008-06-03 Uponus Technologies, Llc System and method for data encryption
KR20020008101A (ko) * 2001-12-12 2002-01-29 주식회사 애니콤소프트웨어 데이터의 비트 인덱스 압축방법
US6892292B2 (en) * 2002-01-09 2005-05-10 Nec Corporation Apparatus for one-cycle decompression of compressed data and methods of operation thereof
US7143191B2 (en) * 2002-06-17 2006-11-28 Lucent Technologies Inc. Protocol message compression in a wireless communications system
WO2004039081A1 (en) * 2002-10-24 2004-05-06 Boram C& C Co., Ltd Real time lossless compression and restoration method of multi-media data and system thereof
US20050027717A1 (en) * 2003-04-21 2005-02-03 Nikolaos Koudas Text joins for data cleansing and integration in a relational database management system
CN100412863C (zh) * 2005-08-05 2008-08-20 北京人大金仓信息技术有限公司 一种海量数据紧缩存储方法及执行装置
SE530081C2 (sv) * 2005-10-24 2008-02-26 Algotrim Ab Metod och system för datakomprimering
KR101385956B1 (ko) * 2007-08-31 2014-04-17 삼성전자주식회사 미디어 신호 인코딩/디코딩 방법 및 장치
US8326605B2 (en) * 2008-04-24 2012-12-04 International Business Machines Incorporation Dictionary for textual data compression and decompression
US8326604B2 (en) * 2008-04-24 2012-12-04 International Business Machines Corporation Dictionary for textual data compression and decompression
EP2417578B1 (en) * 2009-04-09 2017-08-30 Thomson Licensing Method and device for encoding and decoding of symbol sequences wherein each symbol may have one out of three or more possible symbol values
US8659451B2 (en) * 2009-11-13 2014-02-25 Universitaet Paderborn Indexing compressed data
KR20120134916A (ko) 2011-06-03 2012-12-12 삼성전자주식회사 저장 장치 및 저장 장치를 위한 데이터 처리 장치
US9165008B1 (en) * 2011-12-28 2015-10-20 Teradata Us, Inc. System and method for data compression using a dynamic compression dictionary
WO2014097353A1 (ja) * 2012-12-19 2014-06-26 富士通株式会社 圧縮装置、圧縮方法、圧縮プログラム、伸張装置、伸張方法、伸張プログラム、および圧縮伸張システム
US9628108B2 (en) 2013-02-01 2017-04-18 Symbolic Io Corporation Method and apparatus for dense hyper IO digital retention
US10133636B2 (en) 2013-03-12 2018-11-20 Formulus Black Corporation Data storage and retrieval mediation system and methods for using same
US9304703B1 (en) 2015-04-15 2016-04-05 Symbolic Io Corporation Method and apparatus for dense hyper IO digital retention
US9467294B2 (en) * 2013-02-01 2016-10-11 Symbolic Io Corporation Methods and systems for storing and retrieving data
US9817728B2 (en) 2013-02-01 2017-11-14 Symbolic Io Corporation Fast system state cloning
JP5808361B2 (ja) * 2013-04-08 2015-11-10 日本電信電話株式会社 文字列圧縮及び復元システム並びに方法
JP5808360B2 (ja) * 2013-04-08 2015-11-10 日本電信電話株式会社 文字列圧縮及び復元システム並びに方法
JP6341059B2 (ja) * 2014-10-31 2018-06-13 オムロン株式会社 文字認識装置、文字認識方法、およびプログラム
JP6543922B2 (ja) 2014-12-10 2019-07-17 富士通株式会社 インデックス生成プログラム
JP6531398B2 (ja) 2015-01-19 2019-06-19 富士通株式会社 プログラム
JP6742692B2 (ja) * 2015-01-30 2020-08-19 富士通株式会社 符号化プログラムおよび伸長プログラム
CN104579360B (zh) * 2015-02-04 2018-07-31 华为技术有限公司 一种数据处理的方法和设备
JP2016170750A (ja) 2015-03-16 2016-09-23 富士通株式会社 データ管理プログラム、情報処理装置およびデータ管理方法
JP6256883B2 (ja) * 2015-03-25 2018-01-10 国立大学法人 筑波大学 データ圧縮・解凍システム、データ圧縮方法及びデータ解凍方法、並びにデータ圧縮器及びデータ解凍器
US10061514B2 (en) 2015-04-15 2018-08-28 Formulus Black Corporation Method and apparatus for dense hyper IO digital retention
JP6613669B2 (ja) * 2015-07-14 2019-12-04 富士通株式会社 圧縮プログラム、圧縮方法、情報処理装置、置換プログラムおよび置換方法
JP6536243B2 (ja) * 2015-07-16 2019-07-03 富士通株式会社 符号化プログラム、符号化装置、符号化方法、照合プログラム、照合装置および照合方法
JP6641857B2 (ja) * 2015-10-05 2020-02-05 富士通株式会社 符号化プログラム、符号化方法、符号化装置、復号化プログラム、復号化方法および復号化装置
JP2017126185A (ja) * 2016-01-13 2017-07-20 富士通株式会社 符号化プログラム、符号化方法、符号化装置、復号化プログラム、復号化方法および復号化装置
JP6686639B2 (ja) * 2016-03-31 2020-04-22 富士通株式会社 符号化プログラム、符号化装置、符号化方法、復号化プログラム、復号化装置および復号化方法
JP6648620B2 (ja) * 2016-04-19 2020-02-14 富士通株式会社 符号化プログラム、符号化装置および符号化方法
US9729168B1 (en) * 2016-07-17 2017-08-08 Infinidat Ltd. Decompression of a compressed data unit
JP7210130B2 (ja) * 2017-04-07 2023-01-23 富士通株式会社 符号化プログラム、符号化方法および符号化装置
US10572186B2 (en) 2017-12-18 2020-02-25 Formulus Black Corporation Random access memory (RAM)-based computer systems, devices, and methods
JP7159557B2 (ja) 2017-12-28 2022-10-25 富士通株式会社 動的辞書の生成プログラム、動的辞書の生成方法および復号化装置
US10897270B2 (en) * 2018-06-06 2021-01-19 Yingquan Wu Dynamic dictionary-based data symbol encoding
WO2020142431A1 (en) 2019-01-02 2020-07-09 Formulus Black Corporation Systems and methods for memory failure prevention, management, and mitigation
US11122095B2 (en) * 2019-09-23 2021-09-14 Netapp, Inc. Methods for dictionary-based compression and devices thereof
KR102385867B1 (ko) * 2020-06-02 2022-04-13 주식회사 스캐터엑스 시각화를 위한 데이터 압축 방법 및 그 장치
CN116894016A (zh) * 2023-06-15 2023-10-17 北京城建智控科技股份有限公司 轨道交通信号的日志压缩方法及装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4876541A (en) * 1987-10-15 1989-10-24 Data Compression Corporation Stem for dynamically compressing and decompressing electronic data
US4881075A (en) * 1987-10-15 1989-11-14 Digital Equipment Corporation Method and apparatus for adaptive data compression
JP3231105B2 (ja) * 1992-11-30 2001-11-19 富士通株式会社 データ符号化方式及びデータ復元方式
US5467087A (en) * 1992-12-18 1995-11-14 Apple Computer, Inc. High speed lossless data compression system
JP2536422B2 (ja) * 1993-08-31 1996-09-18 日本電気株式会社 デ―タ圧縮装置及びデ―タ復元装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8721117B2 (en) 2007-08-31 2014-05-13 Lg Innotek Co., Ltd. Lighting device
JP2012236970A (ja) * 2010-12-21 2012-12-06 Sumitomo Chemical Co Ltd 高分子化合物及びそれを用いた発光素子

Also Published As

Publication number Publication date
KR970059917A (ko) 1997-08-12
JP3277792B2 (ja) 2002-04-22
EP0788239A3 (en) 1999-03-17
CN1205574C (zh) 2005-06-08
KR100271861B1 (ko) 2000-11-15
AU702207B2 (en) 1999-02-18
IN190446B (zh) 2003-07-26
US5872530A (en) 1999-02-16
SG55271A1 (en) 1998-12-21
JPH09214352A (ja) 1997-08-15
CN1167951A (zh) 1997-12-17
AU1230297A (en) 1997-08-14
EP0788239A2 (en) 1997-08-06

Similar Documents

Publication Publication Date Title
TW312771B (zh)
US6877003B2 (en) Efficient collation element structure for handling large numbers of characters
US6778103B2 (en) Encoding and decoding apparatus using context
US5467087A (en) High speed lossless data compression system
US5374916A (en) Automatic electronic data type identification process
US5870036A (en) Adaptive multiple dictionary data compression
EP0083393B1 (en) Method of compressing information and an apparatus for compressing english text
KR100894002B1 (ko) 선택적 압축과 복원 및 압축 데이터에 대한 데이터 포맷을위한 장치 및 방법
JP3778087B2 (ja) データ符号化装置及びデータ復号装置
US5877711A (en) Method and apparatus for performing adaptive data compression
JPH11215007A (ja) データ圧縮装置及び復元装置並びにその方法
JPH0888568A (ja) データの可逆符号化方法
KR100906041B1 (ko) 폰트 압축 및 검색 방법 및 장치
US8463759B2 (en) Method and system for compressing data
JP3061278B2 (ja) 可変ビット長コード語のビット長通信方法
JP7006462B2 (ja) データ生成プログラム、データ生成方法および情報処理装置
JPS6268325A (ja) 文章圧縮・伸展方式
JP3898717B2 (ja) データ圧縮/復元装置およびデータ圧縮/復元方法
US11967975B1 (en) Method and apparatus for recursive data compression using seed bits
JP3708318B2 (ja) データ圧縮/復元装置およびデータ圧縮/復元方法
JPH1155125A (ja) 文字データの圧縮・復元方法
JP2004013680A (ja) 文字コード圧縮・復元装置および同方法
JPH07282040A (ja) 日本語情報圧縮方式
Ong et al. A data compression scheme for Chinese text files using Huffman coding and a two-level dictionary
Maniya et al. Compression Technique based on Dictionary approach for Gujarati Text