TW312771B - - Google Patents
Download PDFInfo
- Publication number
- TW312771B TW312771B TW086100774A TW86100774A TW312771B TW 312771 B TW312771 B TW 312771B TW 086100774 A TW086100774 A TW 086100774A TW 86100774 A TW86100774 A TW 86100774A TW 312771 B TW312771 B TW 312771B
- Authority
- TW
- Taiwan
- Prior art keywords
- data
- bit
- bit string
- input
- dictionary
- Prior art date
Links
- 238000000034 method Methods 0.000 claims description 113
- 238000013144 data compression Methods 0.000 claims description 103
- 230000007246 mechanism Effects 0.000 claims description 86
- 238000012545 processing Methods 0.000 claims description 59
- 230000008569 process Effects 0.000 claims description 55
- 238000007906 compression Methods 0.000 claims description 46
- 230000006835 compression Effects 0.000 claims description 37
- 230000006837 decompression Effects 0.000 claims description 28
- 238000006243 chemical reaction Methods 0.000 claims description 23
- 238000012546 transfer Methods 0.000 claims description 19
- 238000012217 deletion Methods 0.000 claims description 13
- 230000037430 deletion Effects 0.000 claims description 13
- 230000000875 corresponding effect Effects 0.000 claims description 11
- 238000004891 communication Methods 0.000 claims description 7
- 230000002079 cooperative effect Effects 0.000 claims description 4
- 238000011161 development Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 claims description 2
- 238000004886 process control Methods 0.000 claims 8
- 230000005540 biological transmission Effects 0.000 claims 2
- PCTMTFRHKVHKIS-BMFZQQSSSA-N (1s,3r,4e,6e,8e,10e,12e,14e,16e,18s,19r,20r,21s,25r,27r,30r,31r,33s,35r,37s,38r)-3-[(2r,3s,4s,5s,6r)-4-amino-3,5-dihydroxy-6-methyloxan-2-yl]oxy-19,25,27,30,31,33,35,37-octahydroxy-18,20,21-trimethyl-23-oxo-22,39-dioxabicyclo[33.3.1]nonatriaconta-4,6,8,10 Chemical compound C1C=C2C[C@@H](OS(O)(=O)=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2.O[C@H]1[C@@H](N)[C@H](O)[C@@H](C)O[C@H]1O[C@H]1/C=C/C=C/C=C/C=C/C=C/C=C/C=C/[C@H](C)[C@@H](O)[C@@H](C)[C@H](C)OC(=O)C[C@H](O)C[C@H](O)CC[C@@H](O)[C@H](O)C[C@H](O)C[C@](O)(C[C@H](O)[C@H]2C(O)=O)O[C@H]2C1 PCTMTFRHKVHKIS-BMFZQQSSSA-N 0.000 claims 1
- 206010041349 Somnolence Diseases 0.000 claims 1
- 238000003490 calendering Methods 0.000 claims 1
- 230000001186 cumulative effect Effects 0.000 claims 1
- 238000009434 installation Methods 0.000 claims 1
- 230000003068 static effect Effects 0.000 description 165
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000007639 printing Methods 0.000 description 2
- 102100039845 Guanine nucleotide-binding protein G(I)/G(S)/G(O) subunit gamma-8 Human genes 0.000 description 1
- 101710112841 Guanine nucleotide-binding protein G(I)/G(S)/G(O) subunit gamma-8 Proteins 0.000 description 1
- 241000218206 Ranunculus Species 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000012856 packing Methods 0.000 description 1
- 235000015170 shellfish Nutrition 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3084—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method
- H03M7/3088—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction using adaptive string matching, e.g. the Lempel-Ziv method employing the use of a dictionary, e.g. LZ78
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Document Processing Apparatus (AREA)
Description
經濟部中央揉準局貝工消费合作社印製 312771 at B7 五、發明説明(1 ) 發明背景 未發明係有關一種壓縮與解壓縮資料之方法與裝置, 以及一種使用該方法與裝置的資料處理裝置與網路系統, 其中包含一字串或類似者之資料,被轉換成包含許多資料 位元之一位元串列,該資料位元的數目小於該原始資料的 位元數。 使用該資料壓縮技術以減少佔據一儲存設施(例如一 硬式磁碟)之資料的比率以及將於資料通訊中被轉移之資 料的數量,藉以改進該儲存裝置與通訊路徑之使用效率。 在先前技藝中,具有代表性的資料壓縮方法包含LZ 78與其 —種改進的變化(被描述在1994年由Toppan所出版之"資料 壓縮手冊(Data Compression Handbook)·'的第 221 至 247 頁 中)。 該LZ 7 8與其變化包含以下根據一預定法則壓縮資料之 基本步驟。 (1) 出現於輸入資料中之字串,.以一組字串之形式儲 存於一儲存器中。該組被稱爲一動態字典。 (2) 當已儲存於該動態字典中之一字串再度出現在該 輸入資料中時,產生該字串之一索引(一般爲一正整數)作 爲輸出資料,以取代該動態字典中之字串》 (3) 當該動態字典充滿累積於其中之字串時,停止該 字串之暫存或刪除被暫存之字串。在刪除的操作中,所有 的字串被刪除,或者從最早的字串開始被適當地刪除。 根據先前技藝的方法,由於包含多個字元及/或字母 本紙張尺度逋用中國國家標率(CNS > A4说格(210X297公釐) 83. 3.10,000 ^^1 ^^1 im ^^1 —^ϋ ^^1 ^^1 ^^1 i n (請先閲讀背面之注$項再填寫本頁) 訂 -線_ ―4 一 經濟部中央標準局β;工消费合作社印製 本紙張尺度逋用中國國家梂準(CNS )人4规洛(210Χ297公釐) 312771 B7 五、發明说明(2 ) 之一字串可由一索引加以取代’經由該資料壓縮可將資料 量最小化。此外’根據該法則,藉由以相反方向完成上述 處理步驟,該被壓縮資料可輕易地加以解壓縮。 然而,使用該動態字典的習知資料壓縮方法具有以下 的問題。 (1) 首先出現在該輸入資料中之一字串並未被暫存至 該動態字典。因此,該字串無法代替一索引,因此被直接 地輸出至該字典。亦即’在該輸入資料的前導或第一部分 中之壓縮比明顯地減少。 (2) 由於該輸入資料的字串被循序地暫存至該動態字 典;因此可能發生一字典溢流。爲了應付這種困難,被儲 存之字串將被刪除,例如,如下所示。 (a) 字串至該字典的暫存被中斷。 (b) 儲存於該字典中的所有字串完全被刪除,然後該 字典被初始化。 (c) 較早的字串由該字典刪除,以便將較不早的字串 保留其中。 在這些刪除程序的任何一種情況下,任何一個在該動 態字典中之字串匹配該輸入資料中之一字串的機會,無法 必然地增加。一般而言,一字串匹配任何一個在該動態字 典中之字串的機率很小,因此壓縮比減少。 發明摘要 因此’本發明的一個目的,在於提供一種可以一高壓 83. 3.10,000 ----^------裝------訂 絲 (請先閲讀背面之注意事項再填寫本頁) 5 312771 A7 B7 經濟部中央標準局®C工消费合作社印製 五、發明説明(3 ) 縮比壓縮資料之壓縮資料的方法與裝置。 本發明的另一個目的,在於提供用來壓縮資料之一方 法與一裝置,其中在該輸入資料之第一部分的壓縮比並未 減少。 , 本發明的另一個目的,在於提供一種方法與一種裝置 ,可防止由以一高頻率出現且佔該字典一大量區域之小字 串所造成的壓縮比之減少。 本發明進一步的目的,在於提供用來解壓縮該被壓縮 資料之一方法與一裝置。 本發明的另一個目的,在於提供用來處理資料之一方 法與一裝置,包含資料壓縮與解壓縮功能。 本發明的一個目的,在於提供一種包含資料壓縮與解 壓縮功能之網路系統。 爲了達成上述目的,根據本發明提供以下組態。 首先,一動態字典與一靜態字典被共同地使用,其中 該靜態字典的內容並未改變。具有一高出現頻率之相當長 的字串與其索引,被暫存至該靜態字典。被壓縮資料包含 動態字典之索引資料及該靜態字典之索引。 特定地,輸出一碼,指出該輸入字串(以下將被稱爲 一輸入位元串列)、該動態字典之索引、該靜態字典之索 引以及表示將被使用在該解碼操作中的動態與靜態字典之 一碼中的任何一個。在此種過程中,將該輸入位元串列之 碼的長度加以儲存。在通過該靜態字典的檢取中,將匹配 該輸入位元串列之索引的碼之至少一長度加以儲存。同樣 ---------裝— (請先閲讀背面之注意事項再填寫本頁) 訂 镖 本紙張尺度通用中國國家揉準(CNS) A4現格(210X297公釐) 83. 3.10,000 -6 - 經濟部中央標準局員工消费合作社印製 A7 ___B7 五、發明説明() 4 地,在通過該動態字典的檢取中,將匹配該輸入位元串列 之索引的碼長度加以儲存。由該輸入位元串列之碼與該上 述索引之碼所選擇的最短者,被輸出作爲被壓縮資料。 此外,可採用一種方法,其中當在該靜態字典中檢取 一目標位元串列時,該靜態字典之索引被輸出。 再者,可採用一字典切換方法,其中爲了使用該動態 字典之索引無法完成資料壓縮之一部分,亦即,該輸入資 料之第一部分,例如,其前面500位元組,可使用該輸入 位元串列之碼或該靜態字典之索引加以編碼。 這些方法中的任何一個,解決上述(1)之問題》 其次,爲了解決問題(2),採用以下程序的任何一個 ,包含①具有一低使用頻率或程度的字串並未被暫存至該 動態字典,以及②預測由該字典之一溢流事件,藉以由該 動態字典刪除具有一低使用程度之字串。 在程序①中,特定地,匹配該靜態字典中之一資料項 目的輸入位元串列並未被暫存至該動態字典。 再者,可利用一程序,其中預先調査被使用在該位元 串列至該動態字典的暫存中之索引,以便將該適切的索引 編碼成輸出資料。當該動態字典之索引最後小於該動態索 引時,其暫存被完成。 此外,由該靜態字典之屬性資訊、出現機率、以及位 元串列之間的關係中所選擇的至少一個,可被用來作爲附 加資訊,以便根據該附加資訊暫存該輸入位元串列。 在程序②中,具體而言,該靜態字典之每一位元串列 本紙張尺度適用中國國家梂準(CNS ) A4規格(210X297公釐) ----------^------1T------& (請先Μ讀背面之注意事項再填寫本頁) -7 - 經濟部中央標準局貝工消费合作杜印裝 312771 ;, 五、發明説明() 5 與該附加資訊項目(包含屬性資訊、出現機率、以及位元 串列之間的關係)中的至少一個共同界定,使得具有一低 使用程度之位元串列中的至少一個,根據該附加資訊由該 動態字典刪除。 再者,可使用一種過程,其中該動態字典的大小之上 限值與被暫存之位元串列的數目之上限值中任一者,以及 該動態字典的大小之目前值與被暫存之位元串列的數目之 目前值中住一者被儲存。在該目前值超過該上限值之一溢 流事件中,該系統參考該靜態字典中之位元串列的附加資 訊,以便根據該參考操作之結果,將該位元串列由該動態 字典刪除》 藉由上述過程中之任一者,可解決問題(2)。 當該資料壓縮方法與裝置根據本發明加以實行時,必 須組構一包含具有一高出現頻率之位元串列的靜態字典。 在本發明一較有利的組態中,該靜態字典包含:由包含自 然語言(例如英文與日文)的至少一單一文字之一群組所選 擇的至少任一者或其一部分、該程式語言之至少一保留字 或其一部分、以及該機器語言之至少一指令文字或其一部 分。特別地,該靜態字典之內容包含自然語言之字串,或 是作爲自然語言之名目表示法的字串。將屬性資訊附加至 該字串,語音部分、文字形式之變化、文字之意義 '表示 法等等因而被界定· 在本發明之資料壓縮方法與裝置被實行的一種情況中 ,將小心地考慮該靜態與動態字典之表格組態,以及管理 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) — 裝 i I 線 (請先閲讀背面之注意事項再填寫本頁) 經濟部中央標準為負工消費合作社印製 A7 B7 五、發明説明(6 ) 個別字典之程式的選擇。在該資料壓縮裝置之一特別有利 的結请中包含一動態字典與一靜態字典,該動態字典包含 最多爲21°至215(1K至32K)的索引,而該靜態字典包含最 多爲21 2至2 17(4K至128)的索引。此外,提供一初始化顯 、示幕,以便選擇產生該靜態字典之一程式、將輸入位元串 列暫存至該動態字典之一程式、以及由該動態字典刪除被 暫存的位元串列之一程式,以便爲該靜態與動態字典設定 資料壓縮條件》 再者,當實行本發明之資料壓縮方法與裝置時,必須 在該壓縮來源與目的地之間共享該靜態字典。根據本發明 *經由一網路於一檔案轉移操作中實施該資料壓縮。該資 料壓縮可於以下之組態中完成。當該解碼目的地之裝置可 被識別時,採用一種程序,其中在該靜態字典使用之前, 該靜態字典之共用被確認。可選擇地,可提供一種用於該 靜態字典之一般索引。在此種情況下,該壓縮來源根據對 該壓縮器獨特之一索引,把將被編碼之資料壓縮成該一般 目的索引,然後將該被壓縮資料轉移至該解碼目的地。然 後,根據該一般索引,該資料被轉換成對該解碼器獨特之 一索引。 如上所述,根據本發明之資料壓縮方法,與僅使用該 動態字典之資料壓縮方法相比較,資料壓縮比得以增加。 圖式之簡要說明: 藉由參照以下之說明與附隨之圖式,本發明這些與其 本紙張尺度適用中國國家標準(CNS > A4规格(210X297公釐) 83. 3.10,000 --------秀—— (請先閲讀背面之注意事項再填寫本頁) -a Γ -9 一 312771 A7 B7_ 五、發明説明(7 ) 他的目的與優點將變得明顯,其中: / 圖1爲一流程圖,顯示一種除了使用一動態字典之外 ,還使用一靜態字典之資料壓縮程序; 圖2爲一圖表,顯示採用一動態字典與一靜態字典之 、資料壓縮器的構造; 圖3爲一圖表,用來解說一種使用一動態字典與一靜 態字典以選擇具有一較短位元長度之一索引的程序; 圖4爲一圖表,用來解說一種過程,其中由輸入位元 串列以及該動態與靜態字典個別的索引所選擇之最短者, 被輸出爲壓縮過之資料; ’圖5爲一流程圖,顯示一種優先使用該靜態字典之資 料壓縮方法; 圖6爲一流程圖,顯示一種使用一字典切換操作之資 料壓縮方法; 圖7爲一流程圖,用來解說一種程序,其中匹配該靜 態字典之一位元串列並未被暫存至該動態字典; 圖8爲一流程圖,顯示一種程序,其中將該靜態與動 態字典個別之索引加以計算,而當該動態字典之索引較該 靜態字典之索引短時,該位元串列被暫存至該動態字典; 圖9爲一圖表,顯示包含自然、程式、與機器語言之 至少一字串及其附加資訊之靜態字典的佈局之一範例; 圖10爲一圖表,顯示包含語法規則作爲該附加資訊之 靜態字典的佈局之一範例; 圖11爲一圖表,顯示該附加資訊之另一佈局範例; 本紙張尺度適用中國國家揉準(CNS > A4規格(210X297公釐} ---------1------1T------.^ (請先S讀背面之注$項再填寫本頁) 經濟部中央梂準局貞工消费合作社印装 83. 3.10,000 ~ 10 - 312771 A7 B7 經濟部中央梯準局貝工消費合作社印策 五、發明说明(8 ) 圖12爲一流程圖,顯示一種程序,其中具有一低使用 程度;£位元串列被刪除,以保留一用於其他位元串列暫存 之區域; 圖13爲一圖表’,顯示用來根據附加資訊由該靜態字典 刪除位元串列之構造; 圖14爲一圖表,顯示用來初始化程式類型與壓縮條件 之結構; 圈15爲一圖表,顯示該靜態字典一實施例之構造: 圖16爲一流程圖,顯示當該靜態字典可於一分散式系 統中共享時,用來完成本發明之一程序; 圖17爲一圖表,顯示當該靜態字典無法於一分散式系 統中共享時,根據本發明之一組態; 圖18爲一圖表,顯示根據本發明之被壓縮資料的佈局 與個別索引之間的關係; 圖19爲一圖表,顯示使用該動態與靜態字典之一資料 解壓縮器的結構:以及 圖20爲一流程圖,顯示一種程序,其中資料藉著參照 該靜態與動態字典之索引而被解壓縮。 較佳實施例之說明: 現在將描述具體說明一操作(實施例)之範例,其中一 輸入位元串列與一靜態字典中之位元串列加以比較,根據 比較之一結果,將該位元串列暫存至一動態字典中。然而 ’在此種聯繫中,本發明並未受限於該實施例。 ---------餐-- (請先閲讀背面之注^'項再填寫本頁) 本紙張尺度適用中國國家梯準(CNS ) A4現格(210X297公釐) 83.3.10,000 -11 經濟部中央梂準局貝工消费合作社印製 312771 A 7 B7 五、發明説明(9 ) 首先,參照圖1、2、7與8,將描述該實施例之大綱。 ή 2顯示採用該動態與靜態字典之一資料壓縮裝置的 構造。該資料壓縮器2QQ接收輸入資料2D1作爲一輸入值, 藉著減少該輸入資料201之資料量,將該資料壓縮成被壓 、縮資料205。該壓縮器200由一種作爲一資料處理裝置之電 腦加以實行,例如,一個人電腦。可選擇地,該壓縮器可 藉由一連結於一電腦與一網路之間的專用設施加以實現。 該壓縮器200包含一動態字典控制器230、一靜態字典控制 器240、以及用來監督該壓縮器200整個過程之一控制器 220。例如,該整體控制器220包含一電腦之一中央處理單 元(CPU),該電腦在一作業系統(OS)控制之下作業。該控 制器22 0進一步監督用來輸入將被壓縮之資料的機構221, 以及用來由其輸出被壓縮之資料的機構251。 該動態字典控制器230包含一動態字典231、產生機構 232、檢取機構233與暫存機構234。該動態字典231爲一用 來將位元串列與索引儲存於其中之資料庫,並且在一電腦 系統之一儲存器中建構,例如,在一併入一電腦系統之硬 式磁碟系統中。該產生機構232、檢取機構233與暫存機構 234由管理與處理該動態字典231之程式加以實行。 這些程式被儲存在該電腦系統之硬式磁碟上,並且由 該電腦系統呼叫,以便於其主儲存器之上移動。這些程式 由中央處理單元加以執行,以便完成個別的預定功能。 該靜態字典控制器240包含一靜態字典241、產生機構 242、檢取機構243與暫存機構244。該靜態字典241爲一種 本紙張尺度逋用中國國家梂準(CNS ) A4规格(210X297公釐) 83. 3.10,000 -12 - ---------^------,ΤΓ------0 (請先閲讀背面之注$項再填寫本頁) 經濟部中央梂準局貝工消费合作社印製 A7 B7 五、發明説明(10 ) 位元串列與索引將被儲存於其中之資料庫。該資料庫於一 電腦乏一儲存器中形成,例如,在一併入一電腦系統之硬 式磁碟系統中。該產生機構232、檢取機構233與暫存機構 234由操縱與處理該動態字典231之程式加以實現。 上述程式被儲存在該電腦系統之硬式磁碟上,並且由 該電腦系統呼叫,以便於其主儲存器之上移動。然後這些 程式由中央處理單元加以執行,以便開發預定的功能。 該輸入機構221與輸出機構251包含藉由該電腦系統此 一內部儲存器(例如一硬式磁碟單元)、經由一網路之一遠 端檔案系統、及/或一外部儲存器(例如一軟式磁碟或一磁 帶),以分別完成資料輸入與輸出操作之程式(裝置驅動器 )。該輸入機構221接收且轉換輸入資料201成一種將由其 輸出之输入位元串列202。該輸出機構251接收一輸出位元 串列2 0 4,其爲一種由該動態字典2 3 1或該靜態字典2 4 1所 產生之索引,然後將一控制碼203附加至該被接收之位元 串列2G4,藉以產生被壓縮資料205作爲輸出資料。 圖1爲在採用該動態與靜態字典之圖2的裝置中壓縮資 料之一程序的流程圖。該實施例之資料壓縮程序包含產生 或編譯該靜態字典241與該動態字典231之一初始化過程( 步驟100),以及一資料壓縮過程(步驟120)。 首先將描述步驟100。當該系統之一管理者輸入一命 令指定將被壓縮之一檔案與資料時,該壓縮過程開始(步 驟101)。首先該靜態字典241由產生機構242產生(步驟102 )。特定地,位元串列與索引被界定,例如,根據一文字 本紙張尺度逋用中國國家揉準(CNS > A4规格(210X297公釐) 83.3.10,000 (請先《讀背面之注$項再填寫本頁) r
T -13 - 經濟部中央梯準局貝工消费合作社印裝 312771 A7 B7 五、發明説明(11 ) 處理器之一字典與一電子字典之字串。隨後,該動態字典 231藉由產生機構232被初始化,亦即,空白或預定的位元 串列被暫存至該動態字典231(步驟103)。在該動態字典 231之初始化中,空白的位元串列可被暫存至該動態字典 ,或者其可能暫存包含預定位元串列之基本位元串列,例 如ASCII碼系統之文字碼與其他碼,以及JIS碼系統之文字 碼、片假名(一種日本字母)與平假名(另一種日本字母)》 視該初始化模式、所使用之電腦的儲存容量、及/或用於 索引檢取之一雜湊表(hash table)的結構而定,道些初始 化過程中的任何一個可加以利用。當上述步驟結束時,該 初始化過程便已完成(步驟104)· 在此實施例中,該靜態字典241產生於該動態字典231 之前,然而,其並未限制本發明。亦即,該動態字典231 可於該靜態字典241之前產生。此外,雖然在該實施例中 ’該預定的位元串列包含ASCI I碼系統之文字碼與其他碼 ,以及JIS碼系統之文字碼、片假名(一種日本字母)與平 假名(另一種日本字母),本發明並未受到此實施例之限制 。亦即,其可能採用任何其中每一字元根據一預定法則加 以獨特地界定之碼系統。 隨後’將描述步驟120。當該靜態字典241之產生被確 認時’資料壓縮過程開始(步驟121)。首先,將被壓縮之 資料被輸入至該系統(步驟122)。例如,當該系統使用 UNIX加以實fr時,以標準的輸入模式輸入具有—·特定名稱 之一檔案或資料。根據一預定區段單元(例如,每一區段 本紙張尺度適用中國國家揉準(CNS ) A4规格(210X297公釐) 83. 3.10,000 -----------裝— (請先閲讀背面之注意事項再填寫本頁) 訂_ -锊_ 14 - 經濟部中央揉率局貝工消费合作社印*. A7 B7 五、發明説明(12 ) 64位元),該輸入資料201藉由輸入機構221被解組譯或分 解成*入位元串列202(步驟123)。其次,使用每一輸入位 元串列2 0 2作爲一檢取鍵,藉由決策機構243與參考機構 244完成通過該靜態字典241之一搜尋操作,其將於該決策 、機構243之後開始(步驟124)。此後,該輸入位元串列202 與一由該靜態字典241獲得之位元串列加以比較(步驟125) 〇 使用比較之結果,以及藉由經過該動態字典231之檢 取機構233由該位元串列檢取所獲得者,決定是否該輸入 位元串列將被暫存至該動態字典231(步驟126)。當處於這 種情況下時,藉由暫存機構234,該輸入位元串列202隨著 一索引被暫存至該動態字典(步驟127)。否則,並未完成 任何特定的操作。最後,該輸入位元串列202或匹配該串 列202之索引被輸出爲被壓縮資料205(步驟128)。當存在 另一輸入資料時,控制回到步驟丨〗?;否則,該資料壓縮 過程終止(步驟129與130)。 在此種關聯中,雖然當該資料壓縮過程120在步驟130 中終止時,爲了其後之輸入資料,該靜態字典241藉由上 述實施例中之初始化過程1 〇〇加以初始化,然而本發明並 未受限於該實施例。亦即,該靜態字典2 4 1可以一種半固 定的方式產生,使其不必在該資料壓縮過程12 0終止之後 ’爲了隨後之輸入資料初始化該靜態字典241。此種程序 導致一種使處理時間最小化的有利效果。 現在參照圖7與8,其詳細描述將該輸入位元串列與該 本紙張尺度逋用中國國家標準(CNS ) A4規格(210X297公釐) 83.3.10,000 -15 - ---------1------ir------^ (請先閲讀背面之注$項再填寫本頁) 經濟部中央揉率肩貝工消费合作社印製 A 7 ____B7 五、發明説明(13 ) 靜態字典中之一位元串列比較之處理步驟125的兩個實施 例。’ 在圖7之流程圖中,當該輸入位元串列匹配該靜態字 典241中之位元串列時,該輸入位元串列並未暫存至該動 、態字典231。指定該輸入位元串列作爲一檢取鍵,完成通 過該靜態字典241之一位元串列檢取操作(步驟701),藉以 決定是否該輸入位元串列匹配該靜態字典241中之一位元 串列(步驟702)。當一匹配情況產生時,該輸入位元串列 並未暫存至該動態字典231(步驟703)。否則,該輸入位元 串列被暫存至該動態字典(步驟704)。根據該實施例,可 有利地減少暫存至該動態字典231之位元串列的數目。 在圖8之流程圖中,當該輸入位元串列匹配該靜態字 典241中之一位元串列時,該系統分別計算在該靜態與動 態字典241與231中之索引的長度。當該動態字典231之索 引較小時,該輸入位元串列被暫存至該動態字典231。圖8 之步驟701至704與圖7相同。指定該輸入位元串列作爲一 搜尋鍵,完成通過該靜態字典241之一位元串列搜尋(步驟 701 ),以決定是否該輸入位元串列匹配該靜態字典241中 之一位元串列(步驟702)。當該過程導致一種匹配狀態時 ,摘取一匹配該輸入位元串列之適切的位元串列之索引, 然後記下該索引之長度(步驟801)。利用該輸入位元串列 作爲一檢取鍵,完成通過該動態字典231之一位元串列捜 尋,以決定是否該輸入位元串列匹配該動態字典231中之 一位元串列(步驟811)。當該過程導致一種未匹配之情況 本紙張尺度適用中國國家揉準(CNS ) A4规格(210X297公釐)
1R 83. 3.10,000 — I— II 裝 —訂 II —絲 (請先閲讀背面之注$項再填寫本頁) 312771 A7 B7 經濟部中央揉準局貝工消費合作社印製 五、發明説明(14 ) 時,該系統假定該輸入位元串列被暫存至該動態字典231 ,藉以預測將被指定至該輸入位元串列之一索引,然後記 下該索引之長度(步驟812)。當存在匹配該輸入位元串列 之一位元串列時,並未完成至該動態字典231的暫存(步驟 703)。當步驟702中產生”匹配”,並且在步驟811中決定爲 "不存在”時,記錄於步驟801中之索引與記錄於步驟812中 之索引加以比較(步驟802 )。當該靜態字典241之索引較小 時(步驟803),該輸入位元串列並未被暫存至該動態字典 231(步驟703)。否則(步驟803),該輸入位元串列被暫存 至該動態字典231(步驟704)。當步驟702中產生"未吗配" 時,該輸入位元串列被暫存至該動態字典231(步驟704)。 在該實施例中,根據分別與該靜態與動態字典有關之 輸入位元串列所獲得之索引的長度之間的關係之結果,如 果該動態字典被使用在該適切的位元串列發生時,當一較 高的壓縮比被期待,該輸入位元串列被暫存至該動態字典 。因此,根據該實施例,該壓縮過程偏好以一使用該動態 與靜態字典之較高壓縮比加以完成,藉以由一較高壓縮比 完成該資料壓縮過程。 現在參照圖3、4、5、6與18,將詳細描述該處理步驟 128之一實施例,其中該動態與靜態字典被用來產生該動 態與靜態字典231與241任一者之索引,作爲被壓縮之資料 〇 圖3圖示一種使用該動態與靜態字典選擇具有一較小 位元長度之一索引的操作。當與僅採用動態字典之習知方 ---------^— (請先閱讀背面之注$項存填寫本頁) 訂 線· 本紙張尺度適用中國國家揉準(CNS ) A4規格(210X297公釐) 83.3.10,000 -17 - 經濟部中央梯準為負工消费合作社印装 312771 A7 B7 五、發明说明(15 ) 法相比較時,雖然被壓縮之資料的結構爲複雜的’該壓縮 比受齒改進。 在圖3中,藉由分解一普通句子301所獲得之輸入位兀 串列,匹配界定於該靜態字典中之字串。一般而言,具有 、一相當大的位元長度之字串(例如’包含十個或更多字母 的英文字)被暫存至該靜態字典。再者,長度小於該適切 的字串之一索引被暫存至該靜態字典,藉以改進該壓縮比 該實施例的輸出資料之一範例爲壓縮資料304。該資 料304爲一串列,包含該字典之一索引或位元串列本身204 、識別該項目爲該字典之一索引或位元串列本身之一碼、 以及包含一碼以識別該項目與該動態字典231或該靜態字 典241有關之一控制碼。與藉由僅使用該動態字典之習知 壓縮過程所獲得的被壓縮資料305之碼系統相比較,該碼 系統是複雜的。然而,由於該靜態字典較小的索引大小, 該被壓縮資料304之大小通常小於被壓縮資料305。 其次參照圖4與18,將描述一種實行該程序以產生具 有較小長度之索引的方法。 圖18爲一圖表,顯示該實施例之被壓縮資料的佈局, 以及該資料與索引之間的關係。被壓縮資料項目1801、 1811與1821分別對應於一種其中該輸入位元串列被直接地 編碼之情況、一種其中該動態字典之一索引被編碼之情況 、以及一種其中該靜態字典之一索引被編碼之情況。在此 實施例中,用了解說的簡化,假設該輸入資料包含一以英 本紙張尺度適用中國國家梂牟(CNS ) A4规格(210X297公釐) 83. 3.10,000 ---------1— (請先Μ讀背面之注$項再填寫本頁) 訂 線· -18 - 經濟部中央揲準局負工消费合作社印裝 A7 ______B7_ 五、發明説明(16 ) 文表示之句子,而該資料以一 8位元碼系統(ASCII碼系統) 加以 ίΐ 入。控制碼 1803、1804、1813、1814、1823與 1824 指出該壓縮資料爲該輸入字串之碼、該靜態字典之一索引 、或該動態字典之一索引的碼類型。這些控制碼爲某種未 使用在該資料中作爲一逸出順序之位元串列。在該資料解 碼操作中,輸入至該系統之被壓縮資料,以一種預定的單 位被分解成次資料項目,例如,以一種8位元的單位來識 別該控制碼,使得該位元串列被處理作爲被壓縮資料,直 到一隨後的控制碼出現時。該被壓縮資料1801包含控制碼 1803與1804,而主資料1802介於該控制碼1803與1804之間 。該主資料1802包含具有一固定位元長度之一碼411。在 此種情況下,其長度爲八位元。該被壓縮資料1811包含控 制碼1813與1814,而主資料1812介於該控制碼1813與1814 之間,該主資料1 8 1 2包含一附加之控制碼1 8 1 5。在該動態 字典231中,該資料1812包含一可變長度索引。該控制碼 1815爲一種8位元碼,指示構成該資料1812之索引的長度 。例如,由於該動態字典231之每一索引在圖4之範例中包 含一 6位元碼,一種6位元碼系統之指標被設定至該控制碼 1815。在此種佈局中,該資料1822介於該控制碼1823與18 24之間。在該靜態字典241中,該資料1822包含一索引。 圖4爲一圖表,用來解說一種過程,其中將輸入位元 串列之碼的長度,以及與該輸入位元串列有關之動態與靜 態字典的索引加以訃算,藉以共同決定具有最小資料長度 之一索引》在該實施例中,假定每一具有至少四個字母之 本紙張尺度逋用中國國家標準(CNS ) Α4規格(210Χ297公釐〉 -19 一 83. 3.10,000 ---------^------,ΤΓ------^ (請先閲讀背面之注意事項再填寫本頁) 經濟部中央標準局工消费合作社印装 312771 A7 _______B7 五、發明説明(17 ) 英文字被暫存至該靜態字典。亦即,當以此種組態壓縮這 些英文字時,與其中該英文字之每一字母被編碼或該英文 字被轉換成該動態字典之一索引的操作相比較,採用該靜 態字典乃是有利的。該決策機構243分別計算該輸入位元 、串列之碼以及該動態與靜態字典之索引的長度,然後將這 些長度互相比較,藉以決定最小的長度。該輸入位元串列 202包含8位元碼系統之資料,亦即,一 8位元碼411與一位 元串列412。該靜態字典241包含具有最大長度爲17位元之 一索引241,以及一位元串列42 2。該動態字典包含具有最 大長度爲六位元之一索引,以及一位元串列432。該控制 碼包含八位元。例如,假設作爲該句子401之一構成要素 的文字"This"將被壓縮,該系統計算在個別的表示法中, 需要用來表示該輸入位元串列20 2之碼411、該動態字典 231之索引431、以及該靜態字典241之索引421的位元數β 對該輸入位元串列202之碼411而言,由於每一碼具有一固 定的長度,該碼之長度達到8位元χ4 (構成該位元串列之 字元)。圍繞該項目之控制碼,具有一 8 X 2位元之長度。 其總數則被計算爲8 X 4 + 8 X 2 = 48位元。對該動態字 典231之索引431而言,由於索引之最大長度爲六位元,該 索引之長度達到6位元X 4 (字元)。指示該索引長度6之一 碼爲八位元,而介於該項目之間的控制碼具有一 8 X 2位 元之長度》因此,其總數爲6 X 4 + 8 + 8 X 2 = 48位元 (最大值)。在此範例中,由於對應於"This”之索引爲一 8 位元碼”11111011 ",當在前與隨後的控制碼(8 X 2位元) 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐) 83. 3. !〇,〇〇〇 ---------择------ir------線> (請先閲讀背面之注意事項存填寫本荑) -20 - 經濟部中央標準局貝工消费合作社印簟 A7 _B7_ 五、發明説明(18 ) 被附加至該8位元碼時,產生24位元》在此種情況下,該 系統必是使用該靜態字典241之索引421,藉由該決策機構 243選擇編碼過程。根據該範例,當該動態字典231之索引 431或該輸入位元串列2 02之碼411被選擇時,被壓縮資料 之長度可被減少至大約爲所產生之被壓縮資料的一半。 在上述實施例的描述中,將該動態與靜態字典之索引 的長度加以計算,藉以選擇這些字典中的任何一個。其次 將描述另一實施例,其較偏好使用該靜態字典,其中當該 輸入位元串列匹配該靜態字典中之一位元串列時,該靜態 字典之索引無條件地被輸出》再者,其次將描述另一實施 例’,其使用一字典切換過程,其中提供第一處理位置與第 一資料位置之間的距離之一門限值,以便結合該門限值完 成字典之間的一種轉換操作。 圖5爲用來產生匹配該輸入位元串列之靜態字典的索 引以作爲被壓縮資料之一過程的流程圖。此實施例爲偏好 利用靜態字典之一範例,亦即,圖1用來將該輸入位元串 列與該靜態字典之一位元串列加以比較之處理步驟1 2 5的 一個實施例。首先,完成通過該整體靜態字典241之一位 元串列檢取(步驟5 0 1 )。當一匹配情況被偵測到時(步驟 502),假設該輸入位元串列不需要被暫存至該動態字典 231(步驟503),而該靜態字典241之索引將被輸出(步驟 504)。當一未匹配狀態發生在該位元串列時(步驟502), 假設該位元串列需要被暫存至該動態字典(步驟505),而 該輸入位元串列之碼將被輸出(步驟506)。 本紙張尺度逍用中國國家橾準(CNS ) A4規格(210X297公釐) 83.3.10,000 ---------^------1T------^ (請先閲讀背面之注意事項再填寫本頁) -21 經濟部中央標準局負工消费合作社印裂 A 7 __ B7__ 五、發明説明(19 ) 圖6爲該程序之一流程圖,其中對資料處理位置與第 一資科位置之間的距離配置一門限值,使得該輸入位元串 列與靜態字典被使用在由該第一資料位置至與該門限值有 關的位置之一範圍內,而該輸入位元串列及靜態與動態字 、典被使用在超過與該門限值有關的位置之一範圍內。此實 施例爲採用該字典切換過程之一範例,並且爲圖1與4中所 顯示之資料壓縮過程的另一實施例。此過程乃基於經驗法 則,對於檔案之引導部分,使用該靜態字典乃是有效的。 亦即,當處理由該檔案之第一位置至與該門限值結合之位 置此一範圍內的前面部分時,使用該靜態字典之索引,然 而當處理由該門限值之位置至檔案結束此一範圍內的檔案 時,則採用該動態字典之索引。此實施例不同於圖1之步 驟125與126中所顯示者,在圖1中,該靜態字典被使用, 直到預定門限值的位置,而未完成索引長度之計算。 該實施例包含在初始化過程10 0之前設定一門限值的 初始步驟601至6 0 4以產生字典,以及實質上相等於該資料 壓縮過程120之內部過程的處理步驟601至604之壓縮主處 理步驟61 1至617。 首先將描述初始步驟601至604。在這些步驟中,爲了 決定一特定的門限值,必須決定當資料被輸入時,該輸入 資料與一大小已知之檔案有關,或是與終端並未被決定之 流送資料(例如通訊資料)有關(步驟601)。當處理一檔案 時,檢査其檔案大小,以便根據整體大小計算該門限值, 或者視該檔案大小之值而定,選擇一不規則的門限值(步 本紙張尺度逋用中國國家標牟(CNS ) A4规格(210X297公釐) 83. 3.10,〇〇〇 -22 - III — ^裝— — — II 訂—— — — —— 線 (請先閲讀背面之注$項再填寫本筲) 經濟部中央標準局負工消费合作社印製 312771 A7 B7 五、發明説明(20 ) 驟602)。例如,假設該門限值被設定至一相當於該整體大 小百分之十的位置。在此種情況下,如果該檔案之通常大 小爲,例如,十位元組,該門限值被設定至一相當於相對 該檔案第一位置一位元組的位置。然而,當整體大小較大 時,例如,1 0 0位元組,該門限值被不規則地設定至一相 當於相對該檔案第一位置二至三位元組的位置,而不是被 設定至一相對該檔案第一位置十位元組的通常位置。當處 理流送資料時,採用一固定的初始值(步驟603)。當該門 限值被決定時,其值被設定至將於資料壓縮過程中被參考 之一暫存器(步驟6 04 )。 隨後,將描述壓縮主步驟611至617 »在資料壓縮之步 驟121至123之後,相對於該輸入位元串列之第一位置的位 元數被決定(步驟611),以便與步驟604中所指示之門限值 加以比較(步驟6 1 2 )»當未超過該門限值時,實施通過該 靜態字典的位元串列之一位元串列檢取,藉以獲得匹配該 輸入位元串列之一位元串列(步驟613),然後其一索引被 編碼,以產生輸出資料(步驟615)。當在步驟613中產生未 匹配之情況時,該輸入位元串列之碼被編碼成輸出資料( 步驟616),而該適切的位元串列被暫存至該動態字典(步 驟127)。當在步驟612中超過該門限值時,實施通過該動 態字典的位元串列之一位元串列檢取*藉以獲得匹配該輸 入位元串列之一位元串列(步驟614),然後其一索引被編 碼,以產生輸出資料(步驟617)。當在步驟614中產生未匹 配之情況時,將控制交給其後接著步驟127之步驟616。 本紙張尺度逍用中國國家揉準(cns ) A4说格(2丨〇><297公釐) 83. 3.10,000 ----^------裝-- (請先W讀背面之注$項再填寫本頁) 訂 線 23 - A7 B7 五、發明説明(21 ) 在上述過程完成後,當#在另一輸入資料時(步驟129 ),控‘制再度被轉移至步驟122。當此輸入資料不存在時( 步驟129),該資料壓縮過程被終止(步驟130)。 根據該實施例,基本上執行該過程兩次,以便插入用 、於該字典切換操作之一控制碼。亦即,在兩個控制碼插入 過程中,採用指示是否超過該門限值之碼,並且採用指示 是否該適切的字典包含匹配該輸入位元串列之一位元串列 的碼。因此,該過程被簡化,以便有利地將處理時間最小 化。此外,與字典切換經常發生的情況相比較,控制碼的 數目減少,導致該資料壓縮比最後獲得改進的優點。 現在參照圖9與10,將描述一種在一最佳化系統中實 行資料壓縮裝置與程序之方法。特定地,將描述該靜態字 典之一組態範例,其中考慮一種輸入資料201以自然、程 式、及/或機器語言加以描述之實際情況中,屬性資訊、 出現頻率、及/或一種字串之間的關係被明確地加以辨識 ,藉以根據語言特徵改進資料壓縮比。 經濟部中央標準局貝工消费合作社印製 圖9圖示該靜態字典之一實施例,其包含一個或更多 以一種程式語言加以描述之字串及其附加資訊,特定地, 其顯示一靜態字典900,其包含被使用在C語言的控制述句 中之保留字及其附加資訊。根據該實施例的一個特點’對 暫存至該靜態字典900之一字串901,提供指示該字串901 出現兩次以上的機率之一機率9 0 2作爲附加資訊。例如’ 當已知資料壓縮的客體爲一種以C語言撰寫的原始程式時 ,藉著使用一靜態字典作爲該字典900,得自該靜態字典 83. 3.10,000 ---------装-- (請先閲讀背面之注$項再填寫本頁) 锊 本紙張尺度速用中國國家標準(CNS ) A4規格(210X297公釐) -24 - 312771 A7 B7 經濟部中央梂準局貝工消費合作社印製 五、發明説明62 ) 之索引的输出之比率增加,藉以可期待地改進該資料壓縮 比》ai現頻率機率902只需由多個c語言之原始程式預先加 以調査。亦即,所獲得之結果可被採用爲期待值,而不必 顧及輸入資料的內容。在一位元串列被暫存至該動態字典 或由該動態字典刪除的一種情況中,當該出現機率90在該 位元串列之暫存或刪除中被採用爲順位層級時,將考慮增 加該输入位元串列與該動態字典中之一位元串列之間的匹 配機率。此將進一步地改進該資料壓縮比。再者,在此範 例中,由於具有一較高出現機率值之位元串列被指定至具 有一較小位元長度之一索引9 03,因此可期待檢取速度也 會增加。 圖10顯示包含語言法則作爲該附加資訊之靜態字典的 佈局之一範例,其中藉著解壓縮該靜態字典900,將一靜 態字典1 0 0 0加以組構爲包含文字之表示法或用法。例如, 在C語言中,控制述句可以數種態樣有體系地加以描述。 一種在多個保留字之間建立關係之表示法1001與一索引 1002結合。在此範例中,由於該索引1〇〇2由一3個數字之 整數加以表示,包含多個保留字之一組表示法的碼長度, 小於在該索引903被使用的情況下之碼長度。再者,指定 一結構1003用於與該語法規則結合之被壓縮資料。 附帶地,在此實施例中,雖然該靜態字典包含一程式 語言之字串及其附加資訊,然而本發明並未受限於該實施 例。亦即,該靜態字典可包含一個或更多以一種自然、程 式、或機器語言所表示之字串及其附加資訊。 本紙張尺度適用中國國家梂準(CNS ) A4規格(210X297公釐) 83. 3.10,000 (請先閲讀背面之注意事項再填寫本頁) •裝· 订 -銘- -25 - 經濟部中央揉準局負工消费合作社印製 A7 B7 五、發明説明(23 ) 其次參照圖11至13,將描述一實施例’其中該輸入位 元串到與描述於圖9與1 0之靜態字典的位元串列加以比較 。根據比較之結果,該輸入串列並未暫存至該動態字典或 由該動態字典刪除。 圖11爲本發明採用另一種附加資訊之一實施例。該靜 態字典241包含位元串列1101、用來識別分別對應於由該 位元串列1101所表示的用詞或文字之欄位的附加資訊項目 1102、以及索引1103。在輸入資料201的處理中’其內容 由決策機構243加以分析,以便決定與該輸入資料有關之 一欄位。結果,該輸入資料201之暫存被跳過。或者,任 何徐了與該欄位有關之位元串列以外的位元串列,由該刪 除機構1301加以刪除。圖13爲資料壓縮裝置的構造之一範 例,其中建立至該動態字典231的位元串列之暫存的一個 上限值1302,而一法則1311附加地配置於該決策機構24中 ,藉以根據該靜態字典241之附加資訊,刪除具有一低使 用頻率之位元串列。圖13與圖2之差異,在於其配置當一 種溢流情況被該暫存機構偵測到時被呼叫之刪除機構1301 、一種限制將被暫存至該動態字典2 3 1的位元串列數之一 上限值被設定至該處的暫存器1 302、以及一種根據該靜態 字典之附加資訊決定該適切的位元串列之使用頻率的法則 1 3 1 1 1亦即,是否將完成串列刪除。 圖12爲一流程圖,顯示根據圖13中所顯示的資料壓縮 系統中圖9之出現頻率的附加資訊,以便刪除該位元串列 的程序之一實施例》當一種溢流情況在一输入位元串列至 本紙張尺度逋用中國國家梯準(CNS ) A4規格(210X297公釐) 83. 3.10,000 ---------^------、tr------.^ (請先s讀背面之注意事項再填寫本頁) -26 - 經濟部中央揉準局貝工消费合作社印製 A7 B7 五、發明説明(24 ) 該動態字典的暫存中被偵測到時(步驟1 2 7 ),具有一低使 用頻傘或程度之位元串列由該動態字典刪除,藉以保留用 於該串列暫存之一區域。首先,所計算之輸入位元數與該 上限值1302加以比較。當一種溢流發生於該動態字典中時 ’該_除機構1301被初始化,以便將控制交給步驟1202。 否則,該輸入位元串列以通常的方式暫存至該動態字典( 步驟1206)。在該實施例此種情況中,爲了簡化描述,該 刪除機構1301選擇任何具有一低於該輸入位元串列之出現 機率的位元串列作爲刪除客體。首先,該系統參照被提供 作爲該輸入位元串列之附加資訊的出現機率902(步驟1202 ),以便摘取具有一較低出現機率之位元串列。其後,完 成通過該動態字典231中的位元串列之一位元檢取(步驟 1 2 0 3 )。當偵測到具有一較低使用頻率之一位元串列時(步 驟1204),該系統由該動態字典刪除該位元串列(步驟1205 )° 圖14顯示本發明之一實施例的構造,解說一種用來初 始化程式類型與壓縮條件之操作。根據此實施例之一特點 ,由於該靜態字典與多個產生機構2 42有關,且該動態字 典與多個暫存機構234及多個刪除機構1301結合*該使用 者初始化該程式類型與壓縮條件。該系統進一步包含連接 至該資料壓縮器200之終端機1400。該終端機1400包含一 顯示幕1401以初始化該終端機1400,例如,由一表格選擇 條件。資料壓縮之使用者由該設定中的顯示幕1400選擇產 生機構242、暫存機構234、及/或刪除機構1301。此外, 本紙張尺度逍用中國國家揉準(CNS ) A4规格(210X297公釐) 83. 3.10,000 I ^ I I I I I I ^ 裝— I I I I I 訂— 線 (請先閱讀背面之注意事項再填寫本頁) -27 - 經濟部中央橾準局貝工消费合作社印製 312771 A7 __B7_ 五、發明説明(25 ) 該使用者設定,例如,用於該動態字典中之位元暫存與刪 除的門限值與參考值· 圖15顯示該靜態字典之一實施例的結構。根據該實施 例之一特點,提供該動態與靜態字典分別被應用至該處的 彼此不同之範圍,藉以有利地使用該字典。結果,該靜態 與動態字典個別之索引的最大值,需要處在隨後的一種情 況下。在該靜態字典中*暫存許多具有一相當大的位元串 列之字串。每一暫存至該動態字典中的字串,具有一短的 位元長度與一高的出現頻率。特別地,將被暫存之索引與 至該靜態字典之字串,其位元長度較該動態字典者爲小。 作爲該靜態字典的構造之一實施例,將產生一靜態字典 241,其使用一文字處理器包含大約二萬個字之一字典 1501(前端處理器)的至少一資料庫、一大約100字之英文-曰文字典及/或當字元以日文讀取時給予中文字元意義之 中文-字元-日文字典、及/或一與個別特定欄位有關之百 科全書1 5 03。例如,根據一預定的準則,摘取通常儲存於 其中之文字以產生該靜態字典·在此種情況下,該動態字 典包含最多爲21°至215(1K至32K)的索引,且該靜態字典 包含最多爲21 2至217(4Κ至128)的索引,乃是最佳化的。 圖16爲本發明之一實施例的流程圓,其中該壓縮來源 與解碼目的地之靜態字典可於一分散式系統中共享。此實 施例與圖1不同之處,在於在該字典被初始化之後(步驟 100),在資料壓縮120之前實施產生一詢問之一過程,詢 問該相同之字典是否存在於該解碼目的地中。在該壓縮過 本紙張尺度適用中國困家標準(CNS ) Α4規格(210X297公釐) ----------^------1Τ------i (請先閲讀背面之注意事項再填寫本頁) A7 B7 經濟部中央揉準局β;工消费合作社印製 五、發明説明心) 程之前,經由網路連接至該壓縮系統之一裝置,被指定爲 該解碼目的地。當此實施例被應用至一檔案轉移過程(FTP )時,使用一主機名稱與一 IP位址,作爲將被執行之一命 令的引數。當該解碼目的地被決定時(步驟1601),在該壓 縮來源與該解碼目的地之間建立一種連接(步驟1602)。否 則(步驟1601),該過程將被終止。在該連接建立於步驟 1602中之後,確認在該解碼目的地中的靜態字典之一檔案 名稱*然後檢査該靜態字典之版本與構成要素。基於該檢 查操作的結果,決定是否該解碼目的地與該壓縮來源具有 相同的靜態字典(步驟1603)。當處在這種情況下時,該系 統滦用一種使用該動態字典231與該靜態字典241之一過程 (步驟1610)。否則,選擇另一過程,例如,僅使用該動態 字典231壓縮資料之習知過程,或者將該靜態字典241由該 壓縮來源轉移至該解碼目的地之一過程(步驟1604)。然後 解除其間的連接(步驟1615)。在實施步驟1610之後,該資 料由壓縮來源加以壓縮(步驟120),然後被傳送至該解碼 目的地(步驟1611)。在該解碼目的地中,採用一種與步驟 1610之壓縮過程有關的雙向資料解碼方法(步驟1612),一 旦接收到該資料(1613),該解碼來源將該資料解碼(步驟 16 14)。當上述過程完成時,該壓縮來源與該解碼目的地 之間的連接被解除(步驟1615)。 在此種連接中,雖然步驟1610至1614在該實施例中被 循序地執行,然而本發明並未受限於該實施例。亦即,這 些步驟可以一種管線處理方式加以執行。藉著此種方式, ----------务-- (請先聞讀背面之注意事項再填寫本頁) 訂 本紙張尺度適用中國國家榣準(CNS ) A4規格(210X297公釐) 83. 3.10,000 -29 - A7 B7 經濟部中央楳準局貝工消费合作社印装 五、發明说明(27 ) 可有利地增加處理速度。 圖19與20顯示一裝置與一程序之實施例,用來根據上 述壓縮裝置與程序將被壓縮之資料解壓縮。 圖19顯示採用該動態與靜態字典之資料解壓縮裝置的 ,結構。此實施例結合圖2之壓縮器2 0 0加以組構。根據該實 施例之一特點,通常使用靜態字典241與該壓縮器200之產 生機構242。 一資料解壓縮裝置1900接收該輸入資料205,以便將 該資料解壓縮成資料量小於該輸入資料2G5之被解壓縮資 料。如同該資料壓縮器2QQ—般,該資料解壓縮器1900包 含此種用來作爲一資料處理設施之一電腦,例如一個人電 腦。可選擇地,該解壓縮器1900可由一連接於一電腦與一 網路之間的專用裝置加以實行。該資料解壓縮器1 900包含 —動態字典控制器1 930、一靜態字典控制器1 940、以及一 用來監督該系統之整體處理的控制器1920。該控制器1920 包含在一作業系統(OS)控制之下操作之一電腦的中央處理 單元(CPU)。再者,該控制器1 920控制用來接收將被解壓 縮之輸入資料的機構1921,以及用來輸出被解壓縮資料之 機構1951。 該動態字典控制器193G包含一動態字典1931、產生機 構1932、檢取機構1933與暫存機構1934。該動態字典1931 包含用來將位元串列與其索引儲存於其中之一資料庫,並 且被組構於一電腦之一儲存器中,例如,在併入該電腦之 一硬式磁碟上。該產生機構1932、檢取機構1933與暫存機 ---------^-- (請先閲讀背面之注意事項再填寫本頁) 訂 線 本紙張尺度適用中國國家梯準(CNS ) A4規格(210X:297公釐) 83. 3.10,000 -30 - 經濟部中央揉準局員工消费合作社印裝 312771 atB7五、發明説明(28 ) 構1 9 34則由掌管該動態字典1931之程式加以實行》 這些程式被儲存在該電腦中之一硬式磁碟上,並且在 該電腦啓動時被移動至主儲存器中•然後這些程式由該中 央處理單元執行,以完成預定的功能》 該靜態字典控制器1940包含一靜態字典241、產生機 構242、檢取機構1943與暫存機構1944。該靜態字典241包 含位元串列與其索引被儲存於其中之一資料庫。該字典 241被建構於一電腦之一儲存器中,例如,在併入該電腦 之一硬式磁碟上。該產生機構242、檢取機構194 3與暫存 機構1944則由掌管該靜態字典1941之程式加以實現。 這些程式被儲存在該電腦中之一硬式磁碟上,並且在 該電腦被啓動時移動至主儲存器中。然後這些程式由該中 央處理單元執行,以完成個別的功能。 該輸入機構1921與輸出機構1951,由對該電腦此一整 合式儲存器(例如一硬式磁碟)、經由一網路之一遠端檔案 系統、及/或一外部儲存器(例如一軟式磁碟或一磁帶)分 別完成資料輸入與輸出操作之程式(裝置驅動器)加以實現 。在此種組態中,被壓縮資料205被輸入至該系統。 該輸入機構1921接收該輸入資料205,然後將該資料 轉換成一輸入位元串列1902,以便由其輸出該串列1902。 該輸出機構1951由與該輸入位元串列1902結合之動態或靜 態字典1931或241接收一輸出位元串列1903,以便由其輸 出被解壓縮資料1905。 圖20爲一顯示於圖19中的解壓縮器之一程序的流程圖 ----^------1------1------# (請先W讀背面之注$項再填寫本頁) 本紙張尺度逋用中國國家標準(CNS ) A4規格(210X297公釐) 83. 3.10,000 -31 - 經濟部中央梂準局WC工消费合作社印製 A7 __B7_ 五、發明説明(29 ) ,其中藉著參照該靜態與動態字典241與1931之索引,將 該被_縮資料解壓縮。 該決策機構1943接收該輸入位元串列1902,並且經由 該參考機構244參考該靜態字典241。當該輸入位元串列 1902出現在該靜態字典241中時(步驟2001),該系統參考 使用該輸入位元串列1 902之靜態字典241,以獲得其一索 引以及與其結合之一位元串列(步驟2002 ),藉以輸出該位 元串列(步驟2003)。 在步驟2001中,當在該靜態字典241中不存在適切的 索引時,藉由該檢取機構1933執行通過該動態字典1931之 一捜尋(步驟2011)。當在該動態字典1931中發現該位元串 列時,該系統參考使用該輸入位元串列1 902之動態字典 1931,以獲得其一索引以及與其結合之一位元串列(步驟 2012),藉以輸出該位元串列(步驟2013)·此外,先前獲 得之輸出位元串列與在目前的過程中獲得者加以組合,例 如,包含先前輸出之一位元組的第一位元串列與目前輸出 者加以組合,以便將合成之位元串列暫存至該動態字典 1931(步驟 2014)。 就此而言,在步驟2011中,當該輸入字串1902不存在 於該動態字典1931中時,該輸入字串1902則被視爲錯誤的 ,而該過程以一錯誤過程之訊息加以終止(步驟2050)。 在上述的範例中,實際地實施通過該靜態與動態字典 之串列檢取,藉以決定是否於其中發現該輸入位元串列 1 9 02。該輸入位元串列1 9 02以一種大致相等於該輸出位元 本紙張尺度適用中國國家揉準(CNS > A4规格(210X297公釐) 83.3.10,000 -32 - ------1 裝 訂ir (請先閲讀背面之注意事項再填寫本茛) 經濟部中央梯準局貝工消费合作社印装 A7 B7 五、發明説明(30 ) 串列2 0 3與索引2 0 4之資料佈局而加以組構。結果,當索引 2 04之k用範圍事先分別被設定至該靜態字典(例如,〇至 1023)與該動態字典(例如,1024及以上)時,將可察覺到 該決策過程可以一較高的速度完成,而不必實施該字典檢 '取。 一電腦系統或一個人電腦系統之一資料處理裝置,通 常包含上述之資料壓縮器200與資料解壓縮器1900。所獲 得之資料經由該資料壓縮器200,被儲存至併入該裝置之 一硬式磁碟上。當使用該被儲存資料時,該被壓縮資料由 該硬式磁碟讀取,將由該被解壓縮之資料加以解壓縮成用 於個別使用目的之原始資料。附帶地,在此種情況下,該 靜態字典241可於該資料壓縮器與解壓縮器200與1900之間 共享。該動態字典亦可視情況而定而於其間共享。再者, 當資料處理裝置彼此經由一網路連接以傳送其間之資料時 ,由第一資料處理裝置之資料壓縮器200所壓縮的資料被 轉移至第二資料處理裝置》所接收之資料由該第二資料處 理裝置之資料解壓縮器1900加以解壓縮,將被處理於其中 〇 圖17顯示本發明之一實施例,其中該靜態字典無法於 該分散式系統中的裝置之間共享。該資料;壓縮器200使用 該動態字典231或該靜態字典241將資料壓縮,而該資料編 碼器260使用該動態字典260或該靜態字典261將資料編碼 。該壓縮器200大致與顯示於圖2中之資料壓縮器200相同 。亦即,該壓縮器2GQ接收一句子201,並且將該句子201 本紙張尺度逍用中國國家橾率(CNS ) A4規格(210X297公釐) 83.3.10,000 — —— — —————— 裝— I I I 11 訂.if (請先閱讀背面之注意Ϋ項再填寫本頁) -33 - 經濟部中央橾準局—工消费合作社印装 312771 B7 五、發明説明(31 ) 壓縮成被壓縮資料。該解碼器260完成與該壓縮器200相反 之一資料轉換。亦即,該解碼器260接收該被壓縮資料, 並且將該資料解碼成一句子201。該資料壓縮器200與連接 至經由一網路與資料轉移機構271連合之資料轉移機構270 ,的編碼機構252連結。該轉移機構271與連接至該資料解碼 器260的解碼機構253連結。再者,該編碼機構25 2包含一 靜態字典碼轉換表250,而該解碼機構253包含一靜態字典 碼轉換表251。假設包含文字"computer"與"this"之句子 資料201被輸入至該系統,並且使用該靜態字典241加以壓 縮。藉由該資料壓縮器200,文字” computer"與"this"分 別被變換爲將被傳送至該編碼機構2 5 2作爲被壓縮資料之 一部分的索引”251"與" 357"。接收這些資料項目,該編碼 機構252參考該碼轉換表250,以便將該項目轉換成一般索 引"2 0 4 7 "與"1 0 2 3 "。然後,包含一般索引"2 0 4 7,,與"1 0 2 3 ·, 之合成的被壓縮資料項目,經由該資料轉移機構270、網 路以及資料轉移機構271,被傳送至該解碼機構253。在接 收該資料項目時,該解碼機構253參考該碼轉換表251,以 便將該一般索引"2 G 4 7 "與"1 0 2 3 "分別變換爲對該靜態字典 .2 6 2獨特之索引"3 4 "與"1 4 3 "。包含索引11 3 4 "與"1 4 3 "之被 壓縮資料,被傳輸至該資料解碼器260。該解碼器260接收 該被壓縮資料,然後參考該靜態字典26 2,以便將該索引" 34"與”143”分別轉換成"computer"與"this",藉以產生包 含這些文字的原始句子201。 根據該實施例,該編碼機構252與解碼機構253分別設 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公釐〉 83. 3.10,000 ---------w-- (請先閲讀背面之注意事項再填寫本頁) r
T -34 - 經濟部中夬標率局貝工消費合作社印製 A7 B7 五、發明说明) 有靜態字典碼轉換表250與251,以便將該靜態字典241與 262之索引變換爲一般索引,使得一標準碼格式被界定於 該資料轉移區段中。由於此種設置,彼此具有不同構造的 資料壓縮器與解碼器之間的資料相容性得以確保。 在此種連接中,該編碼與解碼機構252與253於此實施 例中僅完成該索引碼轉換。然而,本發明並未受該實施例 之限制。可採用一種資料編碼與解碼操作可彼此組合之過 程。結果,提供一資料壓縮與編碼裝置,導致該被壓縮資 料可被傳輸通過該網路,並且確保資料安全之優點。根據 本發明,在基於該動態字典之資料壓縮方法中使用該靜態 字典,與只使用該動態字典之資料壓縮比較,資料壓縮比 可獲得改進。特別地,當該靜態字典被使用在無法使用該 動態字典有效率地完成資料壓縮之輸入資料的第一位置之 資料壓縮中時,該資料壓縮比大大地獲得改進。此外,當 區別該動態字典與該靜態字典之一碼被附加至被壓縮資料 之索引時,在解碼過程中的字典切換過程變得更容易。再 者’具有最短碼長度之一項目由該輸入位元串列之碼、該 靜態字典之索引、該動態字典之索引選出,使得該項目被 編碼成被壓縮資料,進一步地改進資料壓縮比。此外,只 有當該動態字典之索引小於用在該輸入位元串列之靜態字 典的索引時*該適切的輸入位元串列才被暫存至該動態字 典。此使得該動態字典的大小最小化。特別地,匹配該靜 態字典中一項目之一位元串列的一索引被輸出作爲被壓縮 資料,同時並未被附加地暫存至該動態字典。此減少該動 本紙張尺度適用中國國家標準(CNS ) A4規格(210X29*7公釐) 83. 3.10,000 I I I I I I I I — 裝^ ^ I I ^ 訂— — I I I (請先閲讀背面之注f項再填寫本頁) Α7 Β7 五、發明説明(33 ) 態字典大小與索引長度,導致資料壓縮比之改進。再者, 在將ίί入位元串列循序地暫存至該動態字典之一操作中, 當該動態字典之資料量到達一預定的資料量時,如果有必 要,另一輸入串列之暫存被禁止,及/或具有一低使用程 ,度或頻率之位元串列由該動態字典刪除。此有利地解決由 該動態字典之位元串列溢流的問題。 雖然本發明已參照特定的例示實施例加以描述,然而 其僅受到附隨之申請專利範圍的限制,而未受到這些實施 例的限制。只要不脫離本發明之範疇與精神,熟習該項技 藝者可改變或修正這些實施例。 ---------裝— (請先閲讀背面之注意事項再填寫本頁) -、?τ 線 經濟部中央梯率為及工消费合作社印装 83. 3.10,000 本紙張尺度逍用中國國家揉準(CNS ) Α4规格(210X297公釐) 36
Claims (1)
- ABCD 312771 六、申請專利範圍 1. 一種資料壓縮方法,其步驟包括: 將輸入資料分解成輸入位元串列; 對該輸入位元串列實施通過一第一字典之一串列檢取 ’該第一字典包含表格資料,該表格資料包含分別與索引 .〆 結合之位元串列,每一索引較該被結合之位元串列爲短; 根據該檢取之一結果,將該輸入位元串列暫存至該第 一字典; 將該輸入位元串列轉換成該輸入位元串列之一碼,或 是對應於該輸入位元串列的第一字典之一索引*藉以將所 獲得之碼或索引輸出爲被壓縮資料; 對該輸入位元串列實施通過一第二字典之一串列檢取 ,藉由以一固定的方式將位元串列預先界定爲輸入候選者 與其索引,將該第二字典加以組構; 將該輸入位元串列與該第二字典中之一位元串列加以 比較;以及 根據該比較之一結果,將該輸入位元串列暫存至該第 一字典。 2. —種資料壓縮裝置,其中輸入資料被分解成輸入 位元串列,以便對該輸入位元串列實施通過一第一字典之 一串列檢取,該第一字典包含表格資料,該表格資料包含 分別與索引結合之位元串列,每一索引較該被結合之位元 串列爲短,根據該檢取之一結果,該輸入位元串列被暫存 至該第一字典,而該輸入位元串列被轉換成該輸入位元串 列之一碼,或是對應於該輸入位元串列的第一字典之一索 本紙張尺度適用中國國家標準(CNS ) A4规格(210X297公釐) ---------1--------1T---------0 (請先閱讀背面之注$項再填寫本頁) 鯉濟部中央橾率局負工消费合作社印製. -37 - A8 E8 C8 D8 經濟部中央橾準局Μζ工消費合作社印製 六、申請專利範圍 引’所獲得之碼或索引被輸出作爲被壓縮資料,包括·· 一第二字典,其係藉由以一固定的方式將位元串列預 先界定爲輸入候選者與其索引而加以組構; 用來產生該第二字典之機構: 用來參考該第二字典之內容的機構;以及 決策機構,用來決定是否一位元串列需要被暫存至該 第一字典,藉以根據得自該決策機構之一結果,將該位元 串列暫存至該第一字典。 3. —種資料壓縮方法,其步驟包括: 將輸入資料分解成輸入位元串列; 對該輸入位元串列實施通過一第一字典之一串列檢取 ’該第一字典包含表格資料,該表格資料包含分別與索引 結合之位元串列,每一索引較該被結合之位元串列爲短; 根據該檢取之一結果,將該輸入位元串列暫存至該第 一字典; 將該輸入位元串列轉換成該輸入位元串列之一碼,或 是對應於該輸入位元串列的第一字典之一索引,藉以將所 獲得之碼或索引輸出爲被壓縮資料;其中 該輸出被壓縮資料之步驟,輸出包含該輸入位元串列 之碼、該第一字典之索引、以及藉由以一固定的方式將位 元串列預先界定爲輸入候選者與其索引而加以組構之一第 二字典的一索引之碼中的任何一者,並且輸出指定將被用 來作爲用於一解碼操作之一字典的第一或第二字典之一碼 (請先閱讀背面之注意事項再填寫本頁) -裝· 訂 本紙張尺度適用中國國家橾率(CNS )八4規格(210X297公釐) -38 - 經濟部中央糅準局貝工消费合作社印輦 C8 D8 々、申請專利範圍 4. 一種資料壓縮方法,其步驟包括: 將輸入資料分解成輸入位元串列: 對該輸入位元串列實施通過一第一字典之一串列檢取 ,該第一字典包含表格資料,該表格資料包含分別與索引 結合之位元串列,每一索引較該被結合之位元串列爲短; 根據該檢取之一結果,將該輸入位元串列暫存至該第 一字典; 將該輸入位元串列轉換成該輸入位元串列之一碼,或 是對應於該輸入位元串列的第一字典之一索引,藉以將所 獲得之碼或索引輸出爲被壓縮資料; 儲存該輸入位元串列的碼之一長度; 儲存一對應於一位元串列匹配該輸入位元串列之第一 字典,以及藉由以一固定的方式將位元串列預先界定爲輸 入候選者與其索引而加以組構之第二字典的至少任何一者 之一索引的長度,其中 該輸出被壓縮資料之步驟,輸出包含該輸入位元串列 與該索引之碼的任何一者,該碼具有一較小的長度。 5.根據申請專利範圍第3項之資料壓縮方法,進一步 包含之步驟爲當匹配該輸入位元串列之一位元串列由該第 二字典檢取時,輸出該第二字典之索引作爲該被壓縮資料 〇 6_根據申請專利範圍第3項之資料壓縮方法,進一步 包含之步驟爲: 記下位元之門限值數目,用來啓始該第一字典之索引 本紙張尺度逍用中國國家橾率(CNS ) A4規格(2丨0X297公釐) ---------1------ΐτ------Μ (請先閲讀背面之注意事項再填寫本頁) -39 - 經濟部中央標準局負工消費合作社印製 Α8 Β8 C8 D8 π、申請專利範圍 的輸出; 根據該輸入位元串列的位元數目與輸入的_數貝其中至 少任何一者,計算被處理之位元的數目,直到一目前的時 間點;以及 當被處理之位元的數目超過該位元之門限值時’輸出 該第一字典之索引作爲該被壓縮資料。 7. 根據申請專利範圍第1項之資料壓縮方法’進一步 包含之步驟爲當匹配該輸入位元串列之一位元串列在該第 二字典中被偵測到時,跳過該輸入位元串列至該第一字典 的暫存。 8. 根據申請專利範圍第1項之資料壓縮方法*其中: 將該輸入位元串列與該第二字典之一位元串列比較的 步驟,記下一匹配該第二字典中的輸入位元串列之一第一 索引的長度:以及 將該輸入位元串列暫存至該第一字典的步驟,結合至 該第一字典的暫存計算一第二索引之一長度,並且當該第 二索引較該第一索引短時,將該第二索引暫存至該第一字 典β 9. 根據申請專利範圍第2項之資料壓縮裝置,其中該 第二字典包含由例如英文或日文之一自然語言的至少一文 字或其一部分、一程式語言的至少一保留字或其一部分、 以及一機器語言的至少一指令或其一部分所選擇之至少一 種字串, 該字典包含由該字串之屬性資訊、其一出現機率、以 本紙張尺度適用中國國家標率(CNS ) Α4規格(210Χ297公釐) (請先閲讀背面之注意事項再填寫本頁) ' -40 - 經濟部中央梯準局員工消费合作社印製 A8 B8 C8 D8 #、申請專利範圍 及該字串之間的關係所選擇之至少一種附加資訊。 10.根據申請專利範圍第9項之資料壓縮裝置,其中: 該第二字典包含一自然語言之一字串,或者在一自然語言 之一規則表示法中之一字串; 該屬性資訊界定語音部分、文字變化、文字意義;以 及 該字串之間的關係界定文字的表示法或用法。 Π.根據申請專利範圍第1項之資料壓縮方法,其中: 在資料被輸入之前界定該位元串列作爲輸入候選者與 其索引以產生該第二字典之步驟,結合該位元串列與索引 ’界定了由該位元串列之屬性資訊、其出現機率、以及該 位元串列之間的關係所選擇之至少一種附加資訊; 將該輸入位元串列與該第二字典之一位元串列比較的 步驟,記下該輸入位元串列之附加資訊;以及 將該輸入位元暫存至該第一字典的步驟,根據該第二 I 字典之附加資訊,跳過該輸入位元串列之暫存。 12.根據申請專利範圍第1項之資料壓縮方法,其中 在資料被輸入之前界定該位元串列作爲輸入候選者與 其索引以產生該第二字典之步驟,結合該位元串列與索引 ’界定了由該位元串列之屬性資訊、其出現機率、以及該 位元串列之間的關係所選擇之至少一種附加資訊; 將該輸入位元串列與該第二字典之一位元串列比較的 步驟,記下該輸入位元串列之附加資訊;以及 將該輸入位元暫存至該第一字典的步驟,根據該第二 本紙張尺度適用中國國家標準(CNS ) A4规格(210X297公釐) —^1 ^^1 In 1^1 In ί — n^i *1 (請先M讀背面之注意事項再填寫本頁) -訂- 經濟部中央標準局男工消费合作社印製 A8 B8 C8 D8 _ 六、申請專利範圍 字典之附加資訊,刪除至少一位元串列。 13. 根據申請專利範圍第2項之資料壓縮裝置’其中 該第二字典包含由該位元串列之屬性資訊、其出現機率、 以及該位元串列之間的關係所選擇之至少一種附加資訊’ 該裝置進一步包含: 至少一刪除機構,用來根據該第二字典之附加資訊’ 將被暫存之位元串列由該第一字典刪除;以及 檢取機構,用來記下由該第一字典一使用率大小之一 上限值與被暫存的位元串列數目之一上限值中所選擇的至 少一個,並且用來由該第一字典檢取該輸入位元串列, 該刪除機構執行用來偵測輸入位元串列之累積數目超 過該上限值之一事件的偵測機構,並且執行用來藉由參考 該第二字典之附加資訊由該第一字典刪除至少一位元串列 的刪除機構。 14. 根據申請專利範圍第2項之資料壓縮裝置,進一 步包含一初始化顯示幕,用來還擇爲了.產生該第二字典的 〆 產生機構之一程式、將該輸入位元串列暫存至該第一字典 之一程式、或者由該第一字典刪除被暫存的位元串列之一 程式,藉以設定用於資料壓縮之一條件。 15. 根據申請專利範圍第2項之資料壓縮裝置,其中: 該第一字典包含最多爲21°至2 15的索引;以及 該第二字典包含最多爲212至217的索引。 16. —種資料壓縮方法,其步驟包括: 將輸入資料分解成输入位元串列: 本紙張尺度適用中國國家標準(CNS > A4規格(210X297公釐) I ϋ I I n I 1· — 裝—— I I I i I I I 線 (請先閱讀背面之注意事項再填寫本頁) -42 - 312771 5? C8 D8 經濟部中央標準局貝工消費合作社印裝 i、申請專利範圍 產生具有空白或預定的基本位元串列之一第一字典; 由該第一字典檢取該輸入位元串列; 將該輸入位元串列暫存军該、第一字典; 將該輸入位元串列與該第一字典之一位元串列的至少 任何一者編碼,並且輸出該編碼之一結果作爲被壓縮資料 > 在資料被輸入之前,界定位元串列作爲輸入候選者與 其索引,並且藉以產生一第二字典;以及 確認其內容大致與該第二字典的內容相等之一字典的 存在,並且輸出該第一與第二字典之索引。 17. —種使用在一分散式系統中之一資料壓縮裝置, 該分散式系統包含至少一資料壓縮裝置與至少一資料解碼 裝置, 該資料壓縮裝置使用根據輸入資料與預先界定之一第 二字典將位元串列暫存至該處之一第一字典壓縮資料, 該資料解碼裝置使用該第一字典以及與該第二字典完 全或部分不同之一第三字典將.資料解碼, 該資料壓縮裝置包含: 編碼機構,用來將資料轉換成一種與該第二字典無關 之一般索引;以及 資料轉移機構,用來由該處傳輸該一般索引, 該資料解碼裝置包含: 資料轉移機構,用來接收該一般索引;.以及 解碼機構,用來將該一般索引變換爲該第三字典之一 (請先閲讀背*之注$項再填窝本頁) .裝· 訂 錄 本紙張纽邮tilB5家梯率(CNS ) A4規格(210X297公釐) —43 - 經濟部中央標率局負工消费合作社印製 A8 B8 C8 ._ D8 ___ 六、申請專利範圍 索引。 18. —種將包含一第一位元串列的資料壓縮且轉換成 .一第二位元串列之資料壓縮方法,該第二位元串列之長度 小於該第一位元串列,其步驟包括: 根據一預定的法則,將包含一第一位元串列之資料轉 換成一第—位兀串列’該第二位元串列具有一較該第一位 元串列小的長度; 根據一表格,其中每一候選輸入資料之一位元串列事 先固定地對應於長度小於該候選輸入資料的位元串列之一 位元串列,將資料轉換成長度較該第二位元串列小之一第 三位元串列; 將該第二位元串列與該第三位元串列加以比較; 決定長度較小的位元串列之一作爲一比較之結果,並 且輸出該位元串列作爲一經過壓縮與轉換之位元串列。 .· ·! 19. 根據申請專利範圍第18項之資料壓縮方法,進一 步包含之步驟爲當比較之結果爲該位元串列彼此大致相等 時,輸出一預定的轉換結果之·一作爲一經過壓縮與轉換之 位元串列。 20. —種將經過壓縮與轉換之資料解壓縮成原始資料 的解壓縮方法,其中包含一第一位元串列之原始資料被轉 換成一第二位元串列,該第二位元串列之長度小於該第一 位元串列,並且根據一表格,其中每一候選輸入資料之一 位元串列事先固定地對應於長度小於該候選輸入資料的位 元串列之一位元串列,將該原始資料轉換成長度小於該第 本紙張纽適用中國困家梯率(CNS)从胁(21()χ29ϋ ~ -44 - (請先閲t»背面之注$項再填寫本頁) :參. 訂 A8 B8 C8 D8 經濟部中央揉率局負工消费合作社印«. ☆、申請專利範圍 二位元串列之一第三位元串列,藉以將該原始資料轉換成 經過壓縮與轉換之資料,其步驟包括: 將根據該預定的法則壓縮與轉換所獲得之位元串列的 一部分位元串列,根據一預定的解壓縮法則,解壓縮與轉 換成該原始資料之一位元串列;以及 將根據該表格轉換之被壓縮且協同的位元、串列,根據 —表格,其中每一候選被壓縮串列固定地對應於該原始輸 入資料之位元串列,解壓縮與轉換成該原始輸入資料之一 位元串列。 2 1.根據申請專利範圍第2G項之資料解壓縮方法,其 中: 使用在壓縮與轉換中之表格,以及使用在解壓縮與轉 換中之表格,具有一種類似的佈局, 被使用在壓縮與轉換中之表格,用來獲得與該候選輸 入資料的位元串列有關之一短的位元串列, 被使用在解壓縮與轉換中之表格,用來獲得該原始輸 入資料之位元串列,作爲與被壓縮之短的位元串列有關之 候選者。 22. 根據申請專利範圍第20項之資料解壓縮方法,其 中使用在壓縮與轉換中之表格,以及使用在解壓縮與轉換 中之表格,爲一原始表格之複製。 23. —種資料壓縮裝置,包括·’ 一第一資料壓縮區段,用來根據一預定的法則,將包 含一第一位元串列之輸入資料轉換成一第二位元串列,該 (請先S讀背面之注$項再填寫本頁) ^. 訂 锊 本紙張尺度遑用中國國家梯率(CNS > A4規格(210X297公釐) -45 - 312771 Α8 Β8 C8 D8 鯉濟部中夬標準局真工消费合作社印製 六、申請專利範圍 第二位元串列具有一較該第一位元串列小的長度; 一第二資料壓縮區段,用來根據一表格,其中每一候 .選輸入資料之一位元串列事先固定地對應於長度小於該候 選輸入資料的位元串列之一位元串列,將該輸入資料轉換 成長度較該第二位元串列小之一第三位元串列;以及 一壓縮控制區段,用來藉由該第一與第二資料壓縮區 段,將該輸入資料轉換成長度小於該輸入資料的位元串列 之一位元串列。 24. 根據申請專利範圍第23項之資料壓縮裝置,其中 該壓縮控制區段將由該第一資料壓縮區段所轉換之位元串 列與由該第二資料壓縮區段所轉換者相比較,並且輸出具 有一較小長度的位元串列之一。 25. —種資料解壓縮裝置,用來將經過壓縮與轉換之 資料,解壓縮成藉由一第一資料壓縮區段與一第二資料壓 縮區段壓縮與轉換之原始資料,該第一資料壓縮區段將包 含一第一位元串列之輸入資料,轉換成長度小於該第一位 元串列之一第二位元串列,該.第二資料壓縮區段根據一表 格,其中每一候選輸入資料之一位元串列事先固定地對應 於長度小於該候選輸入資料的位元串列之一位元串列,將 該輸入資料之位元串列轉換成長度小於該第二位元串列之 一第三位元串列,包括: 一第一資料解壓縮區段,用來根據一預定的法則,將 經過壓縮與轉換之位元串列,解壓縮與轉換成該原始輸入 資料之位元串列; 本^張尺度適用中國β家標準(CNS > A4規格(210X297公釐) (請先閲讀背面之注意事項再填寫本頁) -46 - 經濟部中央標準局負工消费合作社印製· A8 B8 C8 D8 六、申請專利範圍 一第二資料解壓縮區段,用來根據一表格,其中作爲 一輸入候選者之經過壓縮與轉換的位元串列事先固定地對 應於該原始輸入資料之位元串列,將經過壓縮與轉換之位 元串列解壓縮成該原始輸入資料之位元串列;以及 一解壓縮控制區段,用來根據該第一與第二資料壓縮 區段’將經過壓縮與轉換之位元串列解壓縮成該原始輸入 資料之位元串列。 26.根據申請專利範圍第25項之資料解壓縮裝置,其 中: 該第二資料壓縮區段之表格,以及該第二資料解壓縮 區段之表格,具有彼此互相類似的佈局, 該第二資料壓縮區段根據其表格,由作爲一輸入候選 者之輸入資料的位元串列獲得一短的位元串列;以及 該第二資料解壓縮區段根據其表格,由經過壓縮之短 的串列獲得作爲該輸入候選者之原始輸入資料的位元串列 〇 2 7.根據申請專利範圍第25項之資料解壓縮裝置,其 中該第二資料壓縮區段之表格大致與該第二資料解壓縮區 段之表格相同。 28.—種資料處理裝置,包括: 一輸入區段,用來接收資料作爲一輸入; —第一資料壓縮區段,用來根據一預定的法則,將得 自包含一第一位元串列之輸入區段的輸入資料,轉換成一 第二位元串列,該第二位元串列之長度小於該第一位元串 本紙張尺度通用中國固家梯準(CNS ) A4規格(210X297公釐) (請先閲讀背面之注意事項再填寫本頁) 1· 訂 -47 - 經濟部中央標準局貝工消费合作社印11. 312771 il C8 D8 __ 六、申請專利範圍 列; —第二資料壓縮區段,用來根據一表格,其中每一候 選輸入資料之一位元串列事先固定地對應於長度小於該候 選輸入資料的位元串列之一位元串列,將該輸入資料轉換 成長度小於該第二位元串列之一第三位元串列; —壓縮控制區段,用來藉由該第一與第二資料壓縮區 段’將該输入資料轉換成長度小於該输入資料的位元串列 之一位元串列;以及 —輸出區段,用來輸出由該壓縮控制區段所轉換之位 元串列。 29. 根據申請專利範圍第28項之資料壓縮裝置,其中 該壓縮控制器將由該第一資料壓縮區段所換之位元串列 與由該第二資料壓縮區段所轉換者加以比較,並且輸出具 有一較小長度的位元串列之一。 30. —種資料處理裝置,接收由一第一資料壓縮區段 與一第二資料壓縮區段壓縮與轉換之資料作爲一輸入,該 第一資料壓縮區段將包含一第一位元串列之輸入資料,轉 換成長度小於該第一位元串列之一第二位元串列,該第二 資料壓縮區段根據一表格,其中每一候選輸入資料之一位 元串列事先固定地對應於長度小於該候選輸入資料的位元 串列之一位元串列,將該輸入資料之位元串列轉換成長度 小於該第二位元串列之一第三位元串列,包括: 一第一資料解壓縮區段,用來根據一預定的法則,將 經過壓縮與轉換之位元串列,解壓縮與轉換成該原始輸入 本紙張尺度逋用中國困家標隼(CNS) M规格(210X297公釐) ^ n n n ^ n n I .1 n ^ (請先閲讀背面之注意事項再填寫本頁) -48 ~ 經濟部中央梯準局負工消费合作社印製 A8 B8 C8 D8 _六、申請專利範圍 資料之位元串列; 一第二資料解壓縮區段,用來根據一表格,其中作爲 一輸入候選者之經過壓縮與轉換的位元串列事先固定地對 應於該原始輸入資料之位元串列,將經過壓縮與轉換之位 元串列解壓縮成該原始輸入資料之位元串列;以及 一解壓縮控制區段,用來根據該第一與第二資料壓縮 區段,將經過壓縮與轉換之位元串列解壓縮成該原始輸入 資料之位元串列。 31. 根據申請專利範圍第30項之資料處理裝置,其中 該第二資料壓縮區段之表格,以及該第二資料解壓縮 區段之表格,具有彼此互相類似的佈局, 該第二資料壓縮區段根據其表格,由作爲一輸入候選 者之輸入資料的位元串列獲得一短的位元串列;以及 該第二資料解壓縮區段根據其表格,由經過壓縮之短 的串列獲得作爲該輸入候選者之原始輸入資料的位元串列 〇 32. —種資料處理裝置,包括: —輸入區段,用來接收資料作爲一輸入; 一過程控制區段,根據一預定的法則,將得自包含一 第一位元串列之輸入區段的輸入資料,轉換成一第二位元 串列,該第二位元串列之長度小於該第—位元串列;根據 一表格,其中每一候選輸入資料之一位元串列事先固定地 對應於長度小於該候選輸入資料的位元串列之一位元串列 本紙張尺度適用中國固家梯準(CNS ) A4規格(210 X 297公釐) (請先閲讀背面之注意事項再填寫本頁) 訂 A8 B8 C8 D8 312771 六、申請專利乾圍 ,將該输入資料轉換成長度小於該第二位元串列之一第三 位元串列,將被轉換之位元串列互相比較,並且由其輸出 具有一較小長度的位元串列之一;以及 一输出區段,用來輸出由該壓縮控制區段所轉換之位 元串列。 33. —種資料處理裝置,包括: 一輸入區段,用來接收資料作爲一輸入; 一表格,其中每一候選輸入資料之一位元串列固定地 對應於長度小於該候選輸入資料的位元串列之一位元串列 I 一過程控制區段,根據一預定的法則,將得自包含一 第一位元串列之輸入區段的輸入資料,轉換成一第二位元 串列,該第二位元串列之長度小於該第一位元串列;根據 一表格,其中每一候選輸入資料之一位元串列事先固定地 對應於長度小於該候選輸入資料的位元串列之一位元串列 ,將該輸入資料轉換成長度小於該第二位元串列之一第三 位元串列,將被轉換之位元串列互相比較,並且由其輸出 具有一較小長度的位元串列之一;以及 一輸出區段,用來輸出由該壓縮控制區段所轉換之位 元串列。 34. —種資料處理裝置,包括: 一第一表格,其中每一轉換候選輸入資料之一位元串 列’事先固定地對應於長度小於該候選輸入資料的位元串 列之一位元串列; 本紙张尺度適用中國囷家梯率(CNS ) A4規格(210 X 297公釐〉 (請先閲讀背面之注$項再填寫本頁) ^· 經濟部中央揉準局負工消费合作社印掣 -50 - A8 B8 C8 D8 經濟部中央揉準局工消费合作社印裝 六、申請專利範圍 一資料壓縮區段,根據一預定的法則,將包含一第一 位元串列之資料轉換成一第二位元串列,該第二位元串列 之長度小於該第一位元串列;根據該表格,將該資料之位 元串列轉換成長度小於該第二位元串列之一第三位元串列 ,將被轉換之位元串列互相比較,並且由其輸出具有一較 小長度的位元串列之一作爲一經過壓縮與轉換之位元串列 t 一第二表格,其中每一經過壓縮與轉換之位元串列, 事先固定地對應於該原始資料之位元串列;以及 一資料解壓縮區段,根據一預定的法則,將經過壓縮 與轉換之位元串列解壓縮與轉換成該原始資料之位元串列 ,並且根據該表格,將經過壓縮與轉換之位元串列轉換成 該原始資料之位元串列。 3 5.根據申請專利範圍第34項之資料解壓縮裝置,其 中: 該第一與第二表格彼此大致相同; 該資料壓縮區段根據其表格,由作爲一输入候選者之 輸入資料的位元串列獲得一短的位元串列;以及 該資料解壓縮區段根據其表格,由經過壓縮之短的串 列獲得作爲該輸入候選者之原始輸入資料的位元串列。 36.—種網路系統,其中多個資料處理裝置彼此互相 連接,以便用於經由網路傳輸路徑之資料通訊,其中·· 由該多個資料處理裝置所選擇之第一資料處理裝置包 含: (請先閱讀背面之注意事項再填寫本頁) 訂' 本紙張尺度逋用中国國家梯率(CNS ) A4规格(210X297公釐) -51 - 312771 A8 B8 C8 D8 經濟部中央揉準局貝工消费合作社印«. A、申請專利範圍 一表格,其中每一候選輸入資料之一位元串列,事先 固定地對應於長度小於該候選輸入資料的位元串列之一位 .元串列; —過程控制區段,根據一預定的法則,將包含一第一 位元串列之轉移資料轉換成一第二位元串列,該第二位元 串列之長度小於該第一位元串列;根據該表格,將該轉移 資料之位元串列轉換成長度小於該第二位元串列之一第三 位元串列,將被轉換之位元串列互相比較,並,且由其輸出 具有一較小長度的位元串列之一作爲一經過壓縮與轉換之 位元串列; 一資料轉移區段,用來將經過壓縮與轉換之位元串列 ’由該過程控制區段傳輸至骸網路作爲轉移資料:以及 由該多個資料處理裝置隨意地選擇之第二資料處理裝 置包含: 一資料接收區段,用來由該資料轉移區段接收經過壓 縮之資料; 一表格’其中每一經過壓·縮與轉換之位元串列,事先 固定地對應於該原始資料之位元串列;以及 一過程控制區段,根據一預定的法則,將經由該網路 接收之經過壓縮與轉換的位兀串列,解壓縮與轉換成該原 始資料之位元串列,並且根據該表格,將經過壓縮與轉換 之位元串列解壓縮與轉換成該原始資料之位元串列。 37.根據申請專利範圍第36項之網路系統,其中: 該多個資料處理裝置之第一與第二資料處理裝置個別 (婧先Μ讀背面之注$項存填寫本育) -装' 訂 線 本紙張尺度逋用中國國家標率(CNS ) A4规格(210X297公釐) 經濟部中央梂率局員工消费合作社印装 A8 B8 C8 D8 六、申請專利範圍 的表格’其佈局大致彼此相同; 該多個資料處理裝置之第一資料處理裝置根據其表格 由作爲一輸入候選者之輸入資料的位元串列獲得一短的 位元串列;以及 該多個資料處理裝置之第二資料處理裝置根據其表格 ’由經過壓縮之短的串列獲得作爲該輸入候選者之原始輸 入資料的位元串列。 3 8.根據申請專利範圍第36項之網路系統,其中該多 個資料處理裝置之第一與第二資料處理裝置個別的表格, 爲一原始表格之複製。 39. 根據申請專利範圍第36項之網路系統,其中: 該多個資料處理裝置包含至少一伺服器;以及 其他的資料處理裝置由該伺服器複製表格,並且將該 複製之表格儲存於其中。 40. 根據申請專利範圍第36項之網路系統,其中將由 該資料轉移區段轉移至該網路的經過壓縮與轉換之資料, 以一種密碼的系統加以表示。. 41. 一種網路系統,其中多個資料處理裝置彼此互相 連接,以便用於經由網路傳輸路徑之資料通訊,其中: 由該多個用於其間之資料通訊的資料處理裝置所選擇 之至少兩個資料處理裝置的每一個包含: 一表格,其中每一轉換候選輸入資料之一位元串列, 事先固定地對應於長度小於該轉換候選輸入資料的位元串 列之一位元串列; 本紙張尺度適用中國國家糂準(CNS >M规格(210x297公廉) 11 I I^—訂 I I 111 I 絲 (請先閲讀背面之注意事項再填寫本頁) -53 - 經濟部中失標率局員工消费合作社印装 A8 B8 C8 D8六、申請專利範圍 一第一過程控制區段,根據一預定的法則,將包含一 第一位元串列之轉移資料轉換成一第二位元串列,該第二 位元串列之長度小於該第一位元串列;根據該表格,將該 轉移資料之位元串列轉換成長度小於該第二位元串列之一 第三位元串列,根據被轉換之位元串列的一種組合壓縮與 轉換該轉移資料,並且由其輸出所轉換之資料; 一資料轉移區段,用來將經過壓縮與轉換之位元串列 ,由該第一過程控制區段傳輸至該網路作爲轉移資料;以 及 一資料接收區段,用來由該資料處理裝置之一通訊中 的資料處理裝置,經由該網路接收經過壓縮之資料:以及 一第二過程控制區段,根據一預定的法則,將經由該 資料接收區段接收之經過壓縮與轉換的位元串列,解壓縮 與轉換成該原始資料之位元串列,並且根據該表格,將經 過壓縮與轉換之位元串列解壓縮與轉換成該原始資料之位 元串列。 42. —種儲存媒體,將一 ·程式儲存於其中,該程式用 來將包含一第一位元串列之資料轉換成一第二位元串列, 該第二位元串列之長度小於該第一位元串列*其中該程式 包含: 根據一預定的法則,將包含一第一位元串列之資料轉 換成一第二位元串列,該第二位元串列之長度小於該第一 位元串列,並且根據一表格,其中每一候選輸.入資料之一 位元串列事先固定地對應於長度小於該候選輸入資料的位 本紙張尺度逋用中國鬮家橾準(CNS > A4规格(210X297公釐) II I I 裝 — — — — — — 訂 I I 絲 (請先閲讀背面之注$項再填寫本頁) -54 - 趣济部中央棣準局Λ工消势合作社印製 A8 B8 C8 D8 _六、申請專利範圍 元串列之一位元串列,將該候選輸入資料之位元串列轉換 成長度小於該第二位元串列之一第三位元串列; 將被轉·換之位元串列互相比較;以及 根據比較之結果,由其輸出具有一較小長度的位元串 列之一作爲一經過壓縮與轉換之位元串列。 43. 根據申請專利範圍第42項之儲存媒體,其中當被 轉換之位元串列彼此大致相等時,一預定的轉換結果被輸 出作爲經過壓縮與轉換之位元串列。 44. 一種儲存媒體,將一程式儲存於其中,該程式根 據一預定的法則,將包含一第一位元串列之資料轉換成一 第二位元串列,該第二位元串列之長度小於該第一位元串 列,並且根據一表格,其中每一候選輸入資料之一位元串 列事先固定地對應於長度小於該候選輸入資料的位元串列 之一位元串列,將該候選輸入資料之位元串列轉換成長度 小於該第二位元串列之一第三位元串列,並且根據被轉換 之位元串列的一種組合,將經過壓縮與轉換之資料解壓縮 與轉換成該原始資料,該程式包括: 將經過壓縮與轉換之位元串列的一部分位元串列加以 解壓縮與轉換,該部分的位元串列根據該預定的法則加以 壓縮與轉換,藉以根據一預定的解壓縮法則,獲得該原始 資料之位元串列;以及 將經過壓縮與轉換之位元串列的一部分位元串列加以 解壓縮與轉換,該部分的位元串列根據該表格加以壓縮與 轉換,藉以根據一表格,其中作爲候選資料之每一經過壓 本紙張尺度適用中國國家橾準(CNS ) A4規格(210><297公釐) 312771 I I 裝—— 訂— 錄 (請先Μ讀背面之注意事項再填寫本頁) -55 - A8 B8 C8 D8 六、申請專利範圍 縮與轉換的位元串列事先固定地對應於該原始輸入資料的 位元•串列,獲得該原始輸入資料之位元串列。 45. —種資料之被壓縮資料佈局,該資料根據彼此部 分地不同之多個壓縮過程的一種組合加以壓縮,其中 該資料之每一部分包含一碼,該碼識別已處理該適切 的部分之多個過程之一,以及一位元串列,該位元串列由 該碼所識別之壓縮過程加以壓縮。 46. —種資料訊號,用來經由一網路傳輸資料,該資 料根據彼此部分地不同之多個壓縮過程的一種組合加以壓 縮,其中 該資料之每一部分包含一碼,該碼識別已處理該適切 的部分之多個過程之一,以及一位元串列,該位元串列由 該碼所識別之壓縮過程加以壓縮。 I I I I 1^-1 I I I I I 訂 I I I I 鍵 (請先聞讀背面之注意事項再填^本頁) 败濟部中夫橾率局貞工消费合作社印*. 本紙張尺度逍用中國國家標準(CNS ) A4規格(210X297公釐) -56 -
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP01501296A JP3277792B2 (ja) | 1996-01-31 | 1996-01-31 | データ圧縮方法および装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| TW312771B true TW312771B (zh) | 1997-08-11 |
Family
ID=11876975
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW086100774A TW312771B (zh) | 1996-01-31 | 1997-01-24 |
Country Status (9)
| Country | Link |
|---|---|
| US (1) | US5872530A (zh) |
| EP (1) | EP0788239A3 (zh) |
| JP (1) | JP3277792B2 (zh) |
| KR (1) | KR100271861B1 (zh) |
| CN (1) | CN1205574C (zh) |
| AU (1) | AU702207B2 (zh) |
| IN (1) | IN190446B (zh) |
| SG (1) | SG55271A1 (zh) |
| TW (1) | TW312771B (zh) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2012236970A (ja) * | 2010-12-21 | 2012-12-06 | Sumitomo Chemical Co Ltd | 高分子化合物及びそれを用いた発光素子 |
| US8721117B2 (en) | 2007-08-31 | 2014-05-13 | Lg Innotek Co., Ltd. | Lighting device |
Families Citing this family (69)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5951623A (en) * | 1996-08-06 | 1999-09-14 | Reynar; Jeffrey C. | Lempel- Ziv data compression technique utilizing a dictionary pre-filled with frequent letter combinations, words and/or phrases |
| US6163780A (en) | 1997-10-01 | 2000-12-19 | Hewlett-Packard Company | System and apparatus for condensing executable computer software code |
| JP2000165444A (ja) * | 1998-11-30 | 2000-06-16 | Nec Corp | 光パケットスイッチ |
| US6624761B2 (en) * | 1998-12-11 | 2003-09-23 | Realtime Data, Llc | Content independent data compression method and system |
| US6377930B1 (en) | 1998-12-14 | 2002-04-23 | Microsoft Corporation | Variable to variable length entropy encoding |
| US6404931B1 (en) | 1998-12-14 | 2002-06-11 | Microsoft Corporation | Code book construction for variable to variable length entropy encoding |
| US6279062B1 (en) * | 1998-12-28 | 2001-08-21 | Compaq Computer Corp. | System for reducing data transmission between coprocessors in a video compression/decompression environment by determining logical data elements of non-zero value and retrieving subset of the logical data elements |
| US6604158B1 (en) * | 1999-03-11 | 2003-08-05 | Realtime Data, Llc | System and methods for accelerated data storage and retrieval |
| US6601104B1 (en) | 1999-03-11 | 2003-07-29 | Realtime Data Llc | System and methods for accelerated data storage and retrieval |
| US6904402B1 (en) * | 1999-11-05 | 2005-06-07 | Microsoft Corporation | System and iterative method for lexicon, segmentation and language model joint optimization |
| JP3307909B2 (ja) * | 2000-01-24 | 2002-07-29 | ケンテックス株式会社 | 株価データの圧縮方法及び株価データの圧縮送信方法 |
| US20030191876A1 (en) | 2000-02-03 | 2003-10-09 | Fallon James J. | Data storewidth accelerator |
| US20010047473A1 (en) | 2000-02-03 | 2001-11-29 | Realtime Data, Llc | Systems and methods for computer initialization |
| US7026962B1 (en) * | 2000-07-27 | 2006-04-11 | Motorola, Inc | Text compression method and apparatus |
| US9143546B2 (en) | 2000-10-03 | 2015-09-22 | Realtime Data Llc | System and method for data feed acceleration and encryption |
| US8692695B2 (en) * | 2000-10-03 | 2014-04-08 | Realtime Data, Llc | Methods for encoding and decoding data |
| US7417568B2 (en) | 2000-10-03 | 2008-08-26 | Realtime Data Llc | System and method for data feed acceleration and encryption |
| US7054953B1 (en) * | 2000-11-07 | 2006-05-30 | Ui Evolution, Inc. | Method and apparatus for sending and receiving a data structure in a constituting element occurrence frequency based compressed form |
| US6985965B2 (en) * | 2000-11-16 | 2006-01-10 | Telefonaktiebolaget Lm Ericsson (Publ) | Static information knowledge used with binary compression methods |
| TW543311B (en) * | 2000-11-16 | 2003-07-21 | Ericsson Telefon Ab L M | Static information knowledge used with binary compression methods |
| US6883035B2 (en) * | 2000-11-16 | 2005-04-19 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for communicating with temporary compression tables |
| US6606040B2 (en) * | 2001-02-13 | 2003-08-12 | Mosaid Technologies, Inc. | Method and apparatus for adaptive data compression |
| US7386046B2 (en) | 2001-02-13 | 2008-06-10 | Realtime Data Llc | Bandwidth sensitive data compression and decompression |
| US7382878B2 (en) * | 2001-06-22 | 2008-06-03 | Uponus Technologies, Llc | System and method for data encryption |
| KR20020008101A (ko) * | 2001-12-12 | 2002-01-29 | 주식회사 애니콤소프트웨어 | 데이터의 비트 인덱스 압축방법 |
| US6892292B2 (en) * | 2002-01-09 | 2005-05-10 | Nec Corporation | Apparatus for one-cycle decompression of compressed data and methods of operation thereof |
| US7143191B2 (en) * | 2002-06-17 | 2006-11-28 | Lucent Technologies Inc. | Protocol message compression in a wireless communications system |
| WO2004039081A1 (en) * | 2002-10-24 | 2004-05-06 | Boram C& C Co., Ltd | Real time lossless compression and restoration method of multi-media data and system thereof |
| US20050027717A1 (en) * | 2003-04-21 | 2005-02-03 | Nikolaos Koudas | Text joins for data cleansing and integration in a relational database management system |
| CN100412863C (zh) * | 2005-08-05 | 2008-08-20 | 北京人大金仓信息技术有限公司 | 一种海量数据紧缩存储方法及执行装置 |
| SE530081C2 (sv) * | 2005-10-24 | 2008-02-26 | Algotrim Ab | Metod och system för datakomprimering |
| KR101385956B1 (ko) * | 2007-08-31 | 2014-04-17 | 삼성전자주식회사 | 미디어 신호 인코딩/디코딩 방법 및 장치 |
| US8326605B2 (en) * | 2008-04-24 | 2012-12-04 | International Business Machines Incorporation | Dictionary for textual data compression and decompression |
| US8326604B2 (en) * | 2008-04-24 | 2012-12-04 | International Business Machines Corporation | Dictionary for textual data compression and decompression |
| EP2417578B1 (en) * | 2009-04-09 | 2017-08-30 | Thomson Licensing | Method and device for encoding and decoding of symbol sequences wherein each symbol may have one out of three or more possible symbol values |
| US8659451B2 (en) * | 2009-11-13 | 2014-02-25 | Universitaet Paderborn | Indexing compressed data |
| KR20120134916A (ko) | 2011-06-03 | 2012-12-12 | 삼성전자주식회사 | 저장 장치 및 저장 장치를 위한 데이터 처리 장치 |
| US9165008B1 (en) * | 2011-12-28 | 2015-10-20 | Teradata Us, Inc. | System and method for data compression using a dynamic compression dictionary |
| WO2014097353A1 (ja) * | 2012-12-19 | 2014-06-26 | 富士通株式会社 | 圧縮装置、圧縮方法、圧縮プログラム、伸張装置、伸張方法、伸張プログラム、および圧縮伸張システム |
| US9628108B2 (en) | 2013-02-01 | 2017-04-18 | Symbolic Io Corporation | Method and apparatus for dense hyper IO digital retention |
| US10133636B2 (en) | 2013-03-12 | 2018-11-20 | Formulus Black Corporation | Data storage and retrieval mediation system and methods for using same |
| US9304703B1 (en) | 2015-04-15 | 2016-04-05 | Symbolic Io Corporation | Method and apparatus for dense hyper IO digital retention |
| US9467294B2 (en) * | 2013-02-01 | 2016-10-11 | Symbolic Io Corporation | Methods and systems for storing and retrieving data |
| US9817728B2 (en) | 2013-02-01 | 2017-11-14 | Symbolic Io Corporation | Fast system state cloning |
| JP5808361B2 (ja) * | 2013-04-08 | 2015-11-10 | 日本電信電話株式会社 | 文字列圧縮及び復元システム並びに方法 |
| JP5808360B2 (ja) * | 2013-04-08 | 2015-11-10 | 日本電信電話株式会社 | 文字列圧縮及び復元システム並びに方法 |
| JP6341059B2 (ja) * | 2014-10-31 | 2018-06-13 | オムロン株式会社 | 文字認識装置、文字認識方法、およびプログラム |
| JP6543922B2 (ja) | 2014-12-10 | 2019-07-17 | 富士通株式会社 | インデックス生成プログラム |
| JP6531398B2 (ja) | 2015-01-19 | 2019-06-19 | 富士通株式会社 | プログラム |
| JP6742692B2 (ja) * | 2015-01-30 | 2020-08-19 | 富士通株式会社 | 符号化プログラムおよび伸長プログラム |
| CN104579360B (zh) * | 2015-02-04 | 2018-07-31 | 华为技术有限公司 | 一种数据处理的方法和设备 |
| JP2016170750A (ja) | 2015-03-16 | 2016-09-23 | 富士通株式会社 | データ管理プログラム、情報処理装置およびデータ管理方法 |
| JP6256883B2 (ja) * | 2015-03-25 | 2018-01-10 | 国立大学法人 筑波大学 | データ圧縮・解凍システム、データ圧縮方法及びデータ解凍方法、並びにデータ圧縮器及びデータ解凍器 |
| US10061514B2 (en) | 2015-04-15 | 2018-08-28 | Formulus Black Corporation | Method and apparatus for dense hyper IO digital retention |
| JP6613669B2 (ja) * | 2015-07-14 | 2019-12-04 | 富士通株式会社 | 圧縮プログラム、圧縮方法、情報処理装置、置換プログラムおよび置換方法 |
| JP6536243B2 (ja) * | 2015-07-16 | 2019-07-03 | 富士通株式会社 | 符号化プログラム、符号化装置、符号化方法、照合プログラム、照合装置および照合方法 |
| JP6641857B2 (ja) * | 2015-10-05 | 2020-02-05 | 富士通株式会社 | 符号化プログラム、符号化方法、符号化装置、復号化プログラム、復号化方法および復号化装置 |
| JP2017126185A (ja) * | 2016-01-13 | 2017-07-20 | 富士通株式会社 | 符号化プログラム、符号化方法、符号化装置、復号化プログラム、復号化方法および復号化装置 |
| JP6686639B2 (ja) * | 2016-03-31 | 2020-04-22 | 富士通株式会社 | 符号化プログラム、符号化装置、符号化方法、復号化プログラム、復号化装置および復号化方法 |
| JP6648620B2 (ja) * | 2016-04-19 | 2020-02-14 | 富士通株式会社 | 符号化プログラム、符号化装置および符号化方法 |
| US9729168B1 (en) * | 2016-07-17 | 2017-08-08 | Infinidat Ltd. | Decompression of a compressed data unit |
| JP7210130B2 (ja) * | 2017-04-07 | 2023-01-23 | 富士通株式会社 | 符号化プログラム、符号化方法および符号化装置 |
| US10572186B2 (en) | 2017-12-18 | 2020-02-25 | Formulus Black Corporation | Random access memory (RAM)-based computer systems, devices, and methods |
| JP7159557B2 (ja) | 2017-12-28 | 2022-10-25 | 富士通株式会社 | 動的辞書の生成プログラム、動的辞書の生成方法および復号化装置 |
| US10897270B2 (en) * | 2018-06-06 | 2021-01-19 | Yingquan Wu | Dynamic dictionary-based data symbol encoding |
| WO2020142431A1 (en) | 2019-01-02 | 2020-07-09 | Formulus Black Corporation | Systems and methods for memory failure prevention, management, and mitigation |
| US11122095B2 (en) * | 2019-09-23 | 2021-09-14 | Netapp, Inc. | Methods for dictionary-based compression and devices thereof |
| KR102385867B1 (ko) * | 2020-06-02 | 2022-04-13 | 주식회사 스캐터엑스 | 시각화를 위한 데이터 압축 방법 및 그 장치 |
| CN116894016A (zh) * | 2023-06-15 | 2023-10-17 | 北京城建智控科技股份有限公司 | 轨道交通信号的日志压缩方法及装置 |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4876541A (en) * | 1987-10-15 | 1989-10-24 | Data Compression Corporation | Stem for dynamically compressing and decompressing electronic data |
| US4881075A (en) * | 1987-10-15 | 1989-11-14 | Digital Equipment Corporation | Method and apparatus for adaptive data compression |
| JP3231105B2 (ja) * | 1992-11-30 | 2001-11-19 | 富士通株式会社 | データ符号化方式及びデータ復元方式 |
| US5467087A (en) * | 1992-12-18 | 1995-11-14 | Apple Computer, Inc. | High speed lossless data compression system |
| JP2536422B2 (ja) * | 1993-08-31 | 1996-09-18 | 日本電気株式会社 | デ―タ圧縮装置及びデ―タ復元装置 |
-
1996
- 1996-01-31 JP JP01501296A patent/JP3277792B2/ja not_active Expired - Fee Related
-
1997
- 1997-01-24 EP EP97101123A patent/EP0788239A3/en not_active Withdrawn
- 1997-01-24 KR KR1019970002076A patent/KR100271861B1/ko not_active Expired - Fee Related
- 1997-01-24 TW TW086100774A patent/TW312771B/zh active
- 1997-01-24 AU AU12302/97A patent/AU702207B2/en not_active Ceased
- 1997-01-24 IN IN136CA1997 patent/IN190446B/en unknown
- 1997-01-27 SG SG1997000186A patent/SG55271A1/en unknown
- 1997-01-28 US US08/790,063 patent/US5872530A/en not_active Expired - Fee Related
- 1997-01-31 CN CNB971018677A patent/CN1205574C/zh not_active Expired - Fee Related
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8721117B2 (en) | 2007-08-31 | 2014-05-13 | Lg Innotek Co., Ltd. | Lighting device |
| JP2012236970A (ja) * | 2010-12-21 | 2012-12-06 | Sumitomo Chemical Co Ltd | 高分子化合物及びそれを用いた発光素子 |
Also Published As
| Publication number | Publication date |
|---|---|
| KR970059917A (ko) | 1997-08-12 |
| JP3277792B2 (ja) | 2002-04-22 |
| EP0788239A3 (en) | 1999-03-17 |
| CN1205574C (zh) | 2005-06-08 |
| KR100271861B1 (ko) | 2000-11-15 |
| AU702207B2 (en) | 1999-02-18 |
| IN190446B (zh) | 2003-07-26 |
| US5872530A (en) | 1999-02-16 |
| SG55271A1 (en) | 1998-12-21 |
| JPH09214352A (ja) | 1997-08-15 |
| CN1167951A (zh) | 1997-12-17 |
| AU1230297A (en) | 1997-08-14 |
| EP0788239A2 (en) | 1997-08-06 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| TW312771B (zh) | ||
| US6877003B2 (en) | Efficient collation element structure for handling large numbers of characters | |
| US6778103B2 (en) | Encoding and decoding apparatus using context | |
| US5467087A (en) | High speed lossless data compression system | |
| US5374916A (en) | Automatic electronic data type identification process | |
| US5870036A (en) | Adaptive multiple dictionary data compression | |
| EP0083393B1 (en) | Method of compressing information and an apparatus for compressing english text | |
| KR100894002B1 (ko) | 선택적 압축과 복원 및 압축 데이터에 대한 데이터 포맷을위한 장치 및 방법 | |
| JP3778087B2 (ja) | データ符号化装置及びデータ復号装置 | |
| US5877711A (en) | Method and apparatus for performing adaptive data compression | |
| JPH11215007A (ja) | データ圧縮装置及び復元装置並びにその方法 | |
| JPH0888568A (ja) | データの可逆符号化方法 | |
| KR100906041B1 (ko) | 폰트 압축 및 검색 방법 및 장치 | |
| US8463759B2 (en) | Method and system for compressing data | |
| JP3061278B2 (ja) | 可変ビット長コード語のビット長通信方法 | |
| JP7006462B2 (ja) | データ生成プログラム、データ生成方法および情報処理装置 | |
| JPS6268325A (ja) | 文章圧縮・伸展方式 | |
| JP3898717B2 (ja) | データ圧縮/復元装置およびデータ圧縮/復元方法 | |
| US11967975B1 (en) | Method and apparatus for recursive data compression using seed bits | |
| JP3708318B2 (ja) | データ圧縮/復元装置およびデータ圧縮/復元方法 | |
| JPH1155125A (ja) | 文字データの圧縮・復元方法 | |
| JP2004013680A (ja) | 文字コード圧縮・復元装置および同方法 | |
| JPH07282040A (ja) | 日本語情報圧縮方式 | |
| Ong et al. | A data compression scheme for Chinese text files using Huffman coding and a two-level dictionary | |
| Maniya et al. | Compression Technique based on Dictionary approach for Gujarati Text |