JPS5946395B2 - 文字パタ−ンデ−タ圧縮方法 - Google Patents

文字パタ−ンデ−タ圧縮方法

Info

Publication number
JPS5946395B2
JPS5946395B2 JP11239978A JP11239978A JPS5946395B2 JP S5946395 B2 JPS5946395 B2 JP S5946395B2 JP 11239978 A JP11239978 A JP 11239978A JP 11239978 A JP11239978 A JP 11239978A JP S5946395 B2 JPS5946395 B2 JP S5946395B2
Authority
JP
Japan
Prior art keywords
code
sub
pattern data
character pattern
bit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP11239978A
Other languages
English (en)
Other versions
JPS5539956A (en
Inventor
勝正 篠塚
利幸 住田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP11239978A priority Critical patent/JPS5946395B2/ja
Publication of JPS5539956A publication Critical patent/JPS5539956A/ja
Publication of JPS5946395B2 publication Critical patent/JPS5946395B2/ja
Expired legal-status Critical Current

Links

Landscapes

  • Digital Computer Display Output (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】 本発明はドット・マトリックスを用いて表現された文字
パターンデータの圧縮方法に関する。
第1図は漢字「高」を(24行×24列)のドット・マ
トリックスで表現した例で、あるが、画素の黒丸を゛1
’’、空白を゛゛o’’に対応させ、第1百花より右へ
進み、以下第2行、第3行へと順次進めると576ビッ
トのビット列が得られる。文字′ゞターンンデータの圧
縮を行なわない場合はこれを1語として記憶装置に番地
付けして格納する。もしドット・マトリックスの゛01
’’、゛o”が全くランダムに生起するものであればこ
の文字′ゞターンデータを圧縮することは困難であるが
、漢字のドット′ゞターンは一定の統計的傾向を有して
いる。したがつてこの傾向を利用することによつて漢字
′ゞターンデータをもつと短かいデータで表現できる可
能性がある。そこで、漢字パターンが統計的にどのよう
な性質を持つているかを考えてみるとある画素の状態は
、その周囲の画素の状態に対して互いに独立ではなく、
それらの間に極めて強い相関関係のあることが分かる。
例えば、ある画素の周囲の画素の状態がすべて白ならば
その画素の状態も白、反対に周囲が黒ならば、その画素
も黒である確率は極めて高い。さらに周囲の画素もそれ
ぞれ互いに条件が異なり左右上下に隣接した画素が黒で
ある時に、注目している画素が黒である確率と斜めに隣
接した画素が黒である時に、注目している画素が黒であ
る確率とでは、前者の方がはるかに大きいと予想できる
。その理由は漢字には横線または縦線は多く使われるが
、斜めの線はそれに比較して少ないからである。このよ
うな漢字パターンの統計的傾向を利用した漢字パターン
データの圧縮法が既に幾つか提案されている。
その一つは例えば(24×24)のドツト・マトリツク
スを2×2のサブマトリクスに分割し、ハフマン(Hu
ffman)の符号化法を適用するものである。
サブマトリツクスは4個の画素から成つているので、そ
のとり得るパターン(以下サブパターンと呼ぶ)は24
=16通りあり、あるサブマトリクスにどのサブパター
ンが生じるかは、その周囲のサブマトリクスの状態に依
存していると考えられるので、各サブパターンを単独に
符号化するより周囲の条件を考慮して符号化すると効率
が土がる。そこであるサブマトリクスに対して、条件と
なるサブマトリクスを1つだけ定めるものとすると、漢
字の特性を考慮して、土下よりも左右の相関の方が強い
と考えられることから、左隣りまたは右隣りのサブパタ
ーンを条件とすることが望ましい。
ここでは、左隣りに特定のサブパターンが与えられたこ
とを条件として注目するサブマトリクスに生じる16個
のサブパターンに対してハフマンの符号化を行う。24
×24ドツト・マトリツクスの符号語への変換は第2図
に示されるように左土からスタートして、各行毎に右方
向にスキヤニングしていき、右下で終了する方式によつ
てなされる。
ただし、左の欄外に条件付確率を与える初期条件として
、任意のサブパターンがあるものと仮定する。そして最
も自然な初期条件として第3図に示されるサブパターン
を初期条件S。とする。一つの漢字パターンのデータは
次のようにして作られる。
すなわち、サブパターンS。
を条件とした時にS,に割当てられた符号語を先頭にじ
て、順番に次々とSiを条件とした時に、S1+1に割
当てられた符号語を並べSl2まで行ない、次に行を変
え同じくサブパターンS。を条件とした時にSl3に割
当てられた符号語を先頭にして前記と同じ操作を行なう
。この操作をS,44まで行なえば、漢字パターンデー
タが得られる。以上の方法を、明朝体漢字2961文字
について実際に調べた結果、得られたパターンデータの
漢字1個当りの平均符号長は約355ビツトとなつた。
したがつて従来のドツト・マトリツクスパターンをその
まま記憶装置に入れる方法に比べて約38.4%圧縮さ
れたことになる。ハフマン符号の符号長及びハフマン符
号の例は第4図に示す表の通りである。このようにハフ
マンの符号化を行なえば高い圧縮率が得られるが、ハフ
マンの符号化法では1つのサブパターンに対して16個
の符号語から成る1つの符号(符号語の集合)が得られ
るから全部で16通りの異なる符号が得られ、各事象に
与えられる符号は長さに規側性のない符号となつてしま
う。
したがつてこの圧縮法では文字ノマターンデータの復元
が難しく、非常に復雑な復元回路を要するという欠点を
有する。そこで条件となる16通りのサブパターンに対
して第5図の表に示す16個の出現頻度に応じた順位と
等しい長さをもつ可変長符号語を出現頻度の高い順に符
号長の短かいものから割り当てる方法が提案された。
しかしながらこの方法は復号回路が簡単である利点はあ
るが、実際に明朝体漢字2961文字について調べた結
果得られたパターンデータの漢字1個当りの平均符号長
は約384ビツトで、圧縮率は約33.4%に下がり、
あまり高い圧縮率が得られない欠点を有する。本発明は
上記従来の文字ノマターン圧縮方法の欠点を除去するも
ので、圧縮率が高くかつ復元の容易な文字パターン圧縮
方法を提供することを目的とする。
この目的を達成するため、本発明の方法は上記方法と同
様に(M行×N列)のドツト・マトリツクスを用いて表
現された文字パターンを(m行×n列)のサブマトリク
スに分割し、個々のサブマトリクスに対してその隣りの
サブマトリクスを条件とする出現頻度に基いて可変長符
号化を行なうものであつて、上記サブマトリクスのパタ
ーンを出現頻度の大きい順に並べ、順位が2位までのも
のに対しては順位と等しい長さの符号を割り当て、順位
が3位以降のものに対しては順位!と(1十1)(iは
3以上の奇数)の符号長を等しくかつ順位が2つ下がる
ごとに符号長を1ビツトずつ長くすると共に符号の後に
符号の切れ目を示すビツトと上記順位1と(1+1)を
区別するビツトとをつけた符号を割り当てたものである
第6図は本発明の文字パターンデータ圧縮方法に用いた
可変長符号の例を示すものである。
前述のサブノぐターンを出現頻度の大きい順に並べ、順
位が一位と2位のものに対しては順位と等しい1ビツト
と2ビツトの符号長の符号を割り当てる。即ち順位が2
位までのサブ′マターンに対しては、順位をlとすると
“1サを(1−1)個並べ、その後に“0”をつけた符
号を割り当てる。そして順位が3位以降のサブノマター
ンに対しては順位をiとすると、順位がiと(1+1)
のサブパターンに割り当てる符号の長さを等しくし、か
つiが2つ下がることに31″を1個ずつ増やし、その
後に“01をつけ、更にその後に007又は″1”をつ
ける。前記最後のビツト605゛又は″1゛は同符号長
の符号を区別するためのもので、これ以外の“0゛は符
号の切れ目を示すためのものである。このようにして(
M行×N列)のドツト・マトリツクスノマターンを(m
行×n列)のサブマトリクスに分割し、このサブマトリ
クスに対してその隣りのサブマトリクスを条件とする出
現頻度に応じて可変長符号化を行なうと、明朝体漢字2
961文字について調べた結果、漢字1個当りのパター
ンデータの平均符号長は約358ビツトとなり、約37
,9%圧縮された。
この符号化方法によれば、ハフマン符号による圧縮法よ
りやや圧縮率は下がるが、ほとんど同程度の圧縮率で復
号回路がハフマン符号のものより非常に簡単になる。
次に文字パターンデータ圧縮方法によつて圧縮された文
字パターンデータの復号について説明する。
第7図において、文字の内部コードによつて文字パター
ンデータの先頭アドレスを知り、使用している符号の最
大符号長のデータ(上記例では10ビツト)を図示せぬ
メモリから読み出し、シフトレジスタ1に入れる。この
シフトレジスタ1は1クロツク・タイムごとに1ビツト
のシフトを行ない、その結果が2安定素子2に入る。ま
ず最初に2安定素子2に入つたビツトが“0”であつた
場合には、無条件にワンシヨツト・マルチバイブレータ
3を動作させ、サブパターン変換ROM4の出力を、レ
ジスタ5に入る。この場合サブパターン変換ROM4の
下4ビツトのアドレスには60000゛を与える。レジ
スタ5にセツトされたデータが所望のサブパターンであ
り、これはかつ、次のサブパターンを得る条件サブパタ
ーンとなる。
次に最初に2安安素子2に入つたビツトがU1”であつ
た場合にはさらに1ビツトのシフトを行ない2安定素子
6に入れる。この時、2安定素子2が゛0″の場合には
ワンシヨツト・マルチバイブレータ3を動作させサブパ
ターン変換ROM4の出力をレジスタ5に入れる。この
場合サブパターン変換ROMの下4ビツトのアドレスに
は、−0001Wを与える。2安定素子2が61゛の場
合にはワンシヨツト・マルチバイブレータ3は動作させ
ず、カウンタ7に1が加算される。
そして、2安定素子2に゛0にが来るまでカウンタ7に
1を加算し、2安定素子6が1から″′0゛に変わつた
時にワンシヨツト・マルチバイブレータ3を動作させサ
ブパターン変換ROM4の出力をレジスタ5tこ入れる
。この場合サブパターン変換ROM4の下4ビツトのア
ドレスには、カウンタ7の出力と2安定素子2の出力と
を与える。一方、マルチバイブレータ3の出力は遅延回
路8により遅延をうけて、カウンタ7のりセツト端子に
入り、その値を初期値0に戻す。また行カウンタ9はサ
ブノ寸ターンがレジスタ5にセツトされる毎に1が加算
され、その内容が12になつた時、遅延回路10により
遅延をうけた信号がレジスタ5のりセツト端子に入り、
その値を初期条件のサブパターン60000゛に戻す。
以上詳細に説明したように、本発明の文字パターン圧縮
方法によれば、文字パターンデータへの復号が容易であ
ると共に多数の文字パターンを高度に圧縮できる効果が
ある。
【図面の簡単な説明】
第1図は本発明の文字パターンデータ圧縮方法を適用す
る漢字ドツト・マトリツクズノ゛マターンの一例を示す
図、第2図は第1図のドツト・マトリツクスのサブマト
リクスへの分割例を示す図、第3図は初期条件のサブパ
ターンを示す図、第4図はハフマン符号の例を示す図、
第5図は従来の可変長符号の例を示す図、第6図は本発
明で用いた可変長符号の例を示す図、第7図は本発明に
よつて圧縮されたパターンデータの復号回路の一例を示
すプロツク図である。

Claims (1)

    【特許請求の範囲】
  1. 1 今回入力した文字パターンデータの連続した「1」
    の数を計数するカウンタと、このカウンタの出力を第1
    のアドレスとし、前回入力した文字パターンデータを復
    号した結果のサブパターンを第2のアドレスとするサブ
    パターン変換メモリと、このメモリのサブパターン出力
    を蓄積するレジスタとを備え、このレジスタの出力を今
    回入力した文字パターンデータのサブパターンとする復
    号回路に用いる符号において、(M行×N列)のドット
    ・マトリックスを用いて表現された文字パターンデータ
    を(m行×n列)のサブマトリックスに分割してサブパ
    ターンとし、個々のサブマトリックスに対してその隣り
    のサブマトリックスを条件とする出現頻度に基いて可変
    長符号化を行なうものであつて、上記サブパターンを出
    現頻度の大きい順に並べ、順位が2位までのものに対し
    ては順位と等しい長さの符号を割り当て、順位が3位以
    降のものに対してはiを3以上の奇数として順位iと(
    i+1)の符号長を等しくかつ順位が2つ下がるごとに
    符号長を1ビットずつ長くするとともに符号の後に符号
    の切れ目を示すビットと上記順位iと(i+1)を区別
    するビットとをつけた符号を割り当てて上記サブパター
    ン変換メモリに蓄積したことを特徴とする文字パターン
    データ圧縮方法。
JP11239978A 1978-09-14 1978-09-14 文字パタ−ンデ−タ圧縮方法 Expired JPS5946395B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11239978A JPS5946395B2 (ja) 1978-09-14 1978-09-14 文字パタ−ンデ−タ圧縮方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11239978A JPS5946395B2 (ja) 1978-09-14 1978-09-14 文字パタ−ンデ−タ圧縮方法

Publications (2)

Publication Number Publication Date
JPS5539956A JPS5539956A (en) 1980-03-21
JPS5946395B2 true JPS5946395B2 (ja) 1984-11-12

Family

ID=14585677

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11239978A Expired JPS5946395B2 (ja) 1978-09-14 1978-09-14 文字パタ−ンデ−タ圧縮方法

Country Status (1)

Country Link
JP (1) JPS5946395B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57120154A (en) * 1981-01-19 1982-07-27 Kokusai Denshin Denwa Co Ltd <Kdd> Sequential variable length coding system
JPS62160487A (ja) * 1986-01-08 1987-07-16 シャープ株式会社 文字パタ−ンデ−タ圧縮方法
JPH0488443U (ja) * 1990-12-07 1992-07-31

Also Published As

Publication number Publication date
JPS5539956A (en) 1980-03-21

Similar Documents

Publication Publication Date Title
KR20120014910A (ko) 계층적 무손실 압축
US5585793A (en) Order preserving data translation
JPS6221265B2 (ja)
JPH08317227A (ja) 復号化装置
JPS5946395B2 (ja) 文字パタ−ンデ−タ圧縮方法
JPS6134696B2 (ja)
JP2012080470A (ja) 画像処理装置及び画像処理方法
US8488894B2 (en) Method and system for dot-matrix font data compression and decompression
JPS58173791A (ja) 複雑な文字を圧縮する方法
CN119031137B (zh) 一种安防监控视频压缩传输方法及系统
JP5225420B2 (ja) コンピュータによるドットマトリクスフォントデータの圧縮及び解凍のための方法及びシステム
JP3199292B2 (ja) ハフマン符号の符号化でのランレングス抽出方法、ハフマン符号変換方法およびmh符号化処理方法
JPS6365149B2 (ja)
EP0837427A1 (en) Loss-less compression and decompression of bitmaps
JP3199291B2 (ja) ハフマン復号化テーブルの構成方法
JPH05241775A (ja) データ圧縮方式
JPS5936779B2 (ja) 文字パタ−ンデ−タ伝送方式
NL1009035C2 (nl) Werkwijze voor het coderen van een verplaatsing over een in discrete zones verdeeld oppervlak en inrichting voor het in een binaire code omzetten van een dergelijke verplaatsing.
JP3626070B2 (ja) 積符号符号化装置および復号化装置
CN111273882A (zh) Demura Table数据压缩方法以及解压缩方法
KR101573983B1 (ko) 데이터 압축 및 데이터 복원 방법과 장치
JP3532137B2 (ja) データ発生回路
KR100396832B1 (ko) 세미랜덤 인터리버의 데이터 처리방법
SU555395A1 (ru) Устройство дл ввода информации
Houston et al. Compression in the Graphics Pipeline