JPS59139083A - 文字パタ−ンのデ−タ圧縮法 - Google Patents

文字パタ−ンのデ−タ圧縮法

Info

Publication number
JPS59139083A
JPS59139083A JP58012766A JP1276683A JPS59139083A JP S59139083 A JPS59139083 A JP S59139083A JP 58012766 A JP58012766 A JP 58012766A JP 1276683 A JP1276683 A JP 1276683A JP S59139083 A JPS59139083 A JP S59139083A
Authority
JP
Japan
Prior art keywords
character pattern
character
pattern
patterns
picture elements
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58012766A
Other languages
English (en)
Inventor
秀樹 森田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Konica Minolta Inc
Original Assignee
Konica Minolta Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Konica Minolta Inc filed Critical Konica Minolta Inc
Priority to JP58012766A priority Critical patent/JPS59139083A/ja
Publication of JPS59139083A publication Critical patent/JPS59139083A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Controls And Circuits For Display Device (AREA)
  • Digital Computer Display Output (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明はメモリに文字パターンを効率よく準備するため
に、文字パターンのデータ圧縮率を高めるようにした文
字パターンのデータ圧縮法に関する。
最近、情報処理、特に日本語情報の処理技術の研究、開
発が盛んに行なわれているが、日本語情報は文字の種類
が多くしかも漢字の字形が非常に複雑であることから他
の文字、言語(たとえば英文)情報に比べて処理がむづ
かしい。
日本語情報をコンピュータ処理する場合の入出力装置に
ついてみると、全文字種を直接入力しようとすると入力
操作に必要なキーの数が膨大になって装置が大型化し操
作性が悪くなってしまい出力装置としての文字発生器も
複雑で大型化し価格が非常に高くなってし甘う。
そこで日本語情報の処理、特に文字発生には、文字パタ
ーンの記憶媒体にコンピュータ用メモリが使用でき1.
処理が容易で装置の機構が簡単且つ規模が小型化できる
デジタル式が採用される傾向にある。ところがデジタル
式文字発生方式では文字パターンを線(ストローク)や
点(ドツト)の集合で表現するので文字パターンを記憶
するメモリの容量が大容量になるという問題がある。そ
のために、文字パターンを文字の原形を損うことなくで
きるだけ少ないメモリ容量で記憶する方法としてデータ
の圧縮方法が考えられている。
従来知られているデータ圧縮方法としては、ランレング
スコード(Run−1enRun−1en )法による
圧縮法とハフマン(Hu f frnann )の符号
化法による圧縮法とがある。前者は1行あるいは2行を
単位にして、同じパターン(]行単位の場合は白または
黒、2行単位の場合は縦に2つのバ査し、この連続する
部分をパターンの種類と連続する長さによって表現する
圧縮法である。そのため連続する部分が多いほど圧縮率
は良くなり、連続しないで交互に別なパターンが出現す
る場合は圧縮率は悪くなる。通常植字用の文字パターン
(64X64ドツト以上)の圧縮方法としてはランレン
グス法がよく用いられ、90×9θドツトで33〜50
%程度の圧縮率が得られている。後者のハフマン法は、
文字パターンのドツトマトリクスを2X2ドツトあるい
は4×1ドツトのサブパターンに分割し、そのサブパタ
ーンの種類ごとの出現確率に基づいて符号化する方法で
、たとえば28X24ドツトの文字パターンに対して5
0%程度の圧縮率が得ら扛ている。しかし、3×3ドツ
トのサブパターンに対しては32%程度の圧縮率しか得
られない。
ところで、最近日本語ワードプロセッサが普及しつつあ
り、文章の作成や編集などが非常に簡単になった。しか
し、多くのワードプロセッサの文字パターンは24X2
4ドツトであり、弧質的にl−を満足のいくものではな
い。一方、大企業においては、事務書類などを大量に作
成して配布する必要から軽印刷程度の印刷ができる設備
を有しているところが多い。そこで、ワードプロセッサ
で編集した文章が特別にメモリ容量の大きい文字パター
ンを用意することなく軽印刷程度の品質で出力できれば
便利である。
本発明は上記の点にかんがみてなされたもので、文字パ
ターンのデータ圧縮率を高めるために、絵素数の多い文
字パターンを所定ドツトのサブパターンに分割し、予め
用意した絵素数の少ない文字パターンの前記サブパター
ンに対応する位置での1絵素を参照してサブパターンを
予測することによってデータ圧縮を行なうようにしたも
のである。
以下本発明の詳細な説明する。
本発明は、絵素数の多い(mnXmn)ドツトの文字パ
ターンをm X mドツトのサブパターンに分割したと
き、(mn X mn )ドツトの文字パターンとnX
nドツトの文字パターンとは同じ文字に関し対応する位
置にある絵素とサブパターンとけ非常に相関関係が強い
ことに着目し、z mXm通シのザブパターンをその出
現確率に基づいて符号化するようにしたものである。す
なわち、m×mドツトの文字パターンにおける1行ノ列
の絵素が白か黒かによって(mn X mn )ドツト
の文字パターンにおけるi行j列のm×mドツトのサブ
パターンはそれぞれ白絵素の多いパターンまたけ黒絵素
の多いパターンになり易い傾向がある。そこで予じめ用
意したnXnドツトの文字パターンの絵素が白か黒かに
基づいて(mn X mn )ドツトの文字パターンの
m×mドツトのサブパターンの条件つき出現確率を求め
、圧縮率を高めている。
次に本発明の一実施例として、絵素数の多い文字パター
ンとして72X72ドツトすなわち(24X3)X(2
4X3)ドツトの文字パターンを用い、絵素数の少ない
文字パターンとして24X24ドツトの文字パターンを
予め用意しておく。第1図はたとえは「物」という絵素
数の多い文字パターンを3×3ドツトの絵素から成るサ
ブパターンに分割した例を示す。第2図は同じ「物」と
いう文字に対する24X24ドツトの文字パターンであ
る。ここで「・」は白ドツトを、「−」は黒ドツトを意
味している。
この場合サブパターンは512(2’)通り存在し、そ
のうちの代表的なパターンを第3図に示す。実験によ勺
22種の文字(物、量、流、構。
静、議2曇、書、断2強、御、殊、生、会、右。
圧、出2本、も、せ、の、な)についてこのサブパター
ンの出現確率を求めると、次の表1のようになる。
この結果からエントロピーH(I)を求めると、H(I
) =−ΣP(i)log2P(i) = 2.904
1=1 すなわち9(3X3)絵素を理想的な符号化方式を使用
するならば2.904ビツトで符号化が可能であり、こ
の場合の圧縮率は32.3%となる。
ここでエントロピーH(I)とは、平均符号長の最小限
値を示しておシ、データ圧縮の良否はこのエントロピー
の値によって決定され、エントロピーが小さいほど圧縮
が良いことになる。
これに対して本発明によれば、24×24ドツトの文字
パターンを参照し、24×24ドツトの文字パターンの
1行j列の絵素が白か黒かによって72X72ドツトパ
ターンの1行j列のサブパターンを分類するならば、条
件付出現確率P (i/j) [i=1 、2 、・・
・512、j=白、黒〕および同時出現確率P(i、j
)は表2のようになる。
表  2 このときのエントロピーH(I、J)を求めると次のよ
うになる。
理想的には9絵素を2.471ビツトで符号化可能であ
り、圧縮率は27.5%となる。このように従来の圧縮
草に比べて圧縮率を向上することができる。
この場合、実際の符号化法としては、ハフマンの符号化
法が最適な方法としてよ〈知らnているが、m X r
nドツトのサブパターンのすべてについて符号を割当て
ると512通りの符号が必要であるので、複雑な復号化
回路が必要となる。そこで符号化の一例として、出現確
率の高い順に16種類を選択し、その他を一括してハフ
マンの符号化法に基づき表3のように符号を割当てる。
この場合、その他の符号における*申率零本本ネ*ネは
実際のサブパターンの生データであり、たとえば図3に
おける240番目のサブパターンは次のとおシになる。
*傘*******  =  00 100 101 
1このように符号を・割当てれば平均符号′長n(I)
およ、びn(I、J)はそれぞれ次のようになる。
ただしn (t) ;サブパターンiの符号長(従来方
式)n(iN): Jの条件のもとてのサブパターンi
の符号長(本発明による圧縮法) このような符号を使用したときの圧縮率は従来方式では
36.4%、本方式では33.7%となる。
なお、圧縮率とは次の式で定義される。
上記実施例では選んだ22種の文字は日常用いられる文
字の中でもひらがなについては形状が複雑なもの、漢字
については画数の多いものである。従って日本語情報を
構成する平均的文字については圧縮率は上に例示し7た
値よりさらに向上する筈である。
本発明においては予め用意する絵素数の少゛ない文字パ
ターンはワードプロセッサの場合はもともと用いられて
いる24X24ドツトの文字パターンをその1オ用いれ
ばよいが、本発明はワードプロセッサととも圧用いるだ
けでなく、特別に同程度の文字パターンを用意すれば単
独に高いデータ圧縮率で高品質の文字を出力することが
できる。
以上説明したように、本発明においては、絵素数の多い
(mn X m口)ドツトの文字パターン’c m X
 mドツトのサブパターンに分割し、そのサブパターン
を1絵素とするn X nドツトの予め用意した参照文
字パターンの対応する位置の情報に基づいて前記文字パ
ターンの出現確率の程肝に応じて符号化することにより
データの圧縮率を向上することができ、その結果それt
など大容量のメモリを用いずに高品質の文字を出力する
ことができる。そのため、比較的安価でコンパクトな装
置で日本語情報のコンピュータ処理ができる。本発明は
特に絵素数の多い文字パターンの日本語情報の処理に有
効である。
【図面の簡単な説明】
第1図は絵素数の多い文字パターンの一例、第2図は第
1図に示した文字パターンを絵素数の少ない文字パター
ンとして記憶した場合の一例、第3図は第1図に示した
文字パターンを分割したサブパターンの代表的な例であ
る。 特許出願人 小西六写真工業株式会社 代理人 弁理士 鈴 木 弘 男 ○○○ 第2図 0 12 ・・・ 493− 第3図 ・○○    ○○・    ・・○ ・・O○・・    ・・・ O・・    ・・・    ・・・

Claims (2)

    【特許請求の範囲】
  1. (1)  mnXmn (m+ n ;自然数ただしn
    >m)絵素の文字パターンをmXrn絵素のサブパター
    ンに分割し、前記サブパターンを1絵素とするn×n絵
    素の参照文字パターン中の対応する位置の絵素情報に基
    づいて算′出された前記文字パターンの各絵素の出現確
    率の程度に応じて前記mnXmn絵素の文字パターンを
    符号化することを特徴とする文字パターンのデータ圧縮
    法。
  2. (2)前記各絵素の出現確率を記憶し、文字パターンの
    符号化時に該出現確率を読出すことを特徴とする特#′
    l−H求の範囲第1項に記載のデータ圧縮法。
JP58012766A 1983-01-31 1983-01-31 文字パタ−ンのデ−タ圧縮法 Pending JPS59139083A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58012766A JPS59139083A (ja) 1983-01-31 1983-01-31 文字パタ−ンのデ−タ圧縮法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58012766A JPS59139083A (ja) 1983-01-31 1983-01-31 文字パタ−ンのデ−タ圧縮法

Publications (1)

Publication Number Publication Date
JPS59139083A true JPS59139083A (ja) 1984-08-09

Family

ID=11814521

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58012766A Pending JPS59139083A (ja) 1983-01-31 1983-01-31 文字パタ−ンのデ−タ圧縮法

Country Status (1)

Country Link
JP (1) JPS59139083A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01125234A (ja) * 1987-07-31 1989-05-17 Imagen Corp パッチ化システム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01125234A (ja) * 1987-07-31 1989-05-17 Imagen Corp パッチ化システム

Similar Documents

Publication Publication Date Title
US4555191A (en) Method of reducing character font
JPS6165290A (ja) ベクトル文字フオントの作成装置
KR940003198B1 (ko) 코드변환장치
US5444445A (en) Master + exception list method and apparatus for efficient compression of data having redundant characteristics
JPH08289157A (ja) 2値化画像の圧縮のための二次元的方法およびシステム
JPH06169405A (ja) データ圧縮/伸長方法及びその装置
JP3327650B2 (ja) 記録装置
JPS59139083A (ja) 文字パタ−ンのデ−タ圧縮法
Nagao Data compression of Chinese character patterns
Witten Elements of computer typography
KR970007607A (ko) 문자 생성 장치
JPS60144786A (ja) 符号付文字パタ−ン合成出力方式
JPS59139085A (ja) 文字パタ−ンのデ−タ圧縮法
Ulichney Digital scaling of binary images
JP2965429B2 (ja) 文字出力装置
JPS5882376A (ja) 画像形成方式
JP2000123131A (ja) バーコード発生方法
JPS63271495A (ja) 文字処理装置
JPH0392897A (ja) パターン発生装置
JPH02178826A (ja) ページプリンタ
JPS63282787A (ja) 文書編集装置
JPH0213994A (ja) 文字字形の格納及び展開方式
JPS63247795A (ja) 多種字体の文字出力装置
JPS62209590A (ja) 文字処理装置
JPH02130168A (ja) 文字処理装置