JPS58119032A - 情報処理システム - Google Patents

情報処理システム

Info

Publication number
JPS58119032A
JPS58119032A JP57182223A JP18222382A JPS58119032A JP S58119032 A JPS58119032 A JP S58119032A JP 57182223 A JP57182223 A JP 57182223A JP 18222382 A JP18222382 A JP 18222382A JP S58119032 A JPS58119032 A JP S58119032A
Authority
JP
Japan
Prior art keywords
word
character
representation
bit
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP57182223A
Other languages
English (en)
Inventor
イ−フエイ・フエイ・チヤン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPS58119032A publication Critical patent/JPS58119032A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/123Storage facilities
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99936Pattern matching access

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Document Processing Apparatus (AREA)
  • Digital Computer Display Output (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の分野〕 本発明は、ワード全体をそのようなワードを表わす一意
的な単一の表示に翻訳できる情報処理システムに関する
〔背景技術の説明〕
従来のワード%1. !システムは文字コードを基準に
している。このようなシステムでは、システムにワード
を入力する場合、文字単位で入力する。
それから個々の文字がコード化さね、そのようにコード
化された表示がそのシステムで処理される。
文字を基準にしてコード化された表示は、種々の態様で
処理される。例えば記憶されたり、プリンタやディスプ
レイのような出力装置に伝送されたりする。
例えば、7ビツトのASCI Iコードでは、夫々一意
的な7ビツトの表示でコード化された文字を27即ち1
28個の文字まで表わすことができる。従って、データ
の記憶箇所に5文字のワードを置くためには、35ビツ
トの情報が必要となる。
テキストの伝送時には、更に開始ビット、終了ビット及
びエラー検知用の偶数パリティ・ビットなどが各文字の
ための文字コードに通常は付加される。即ち、同じ5文
字のワードでも、伝送時には5×(7+6)即ち50ビ
ツトの情報が必要となる。
本発明のシステムではワード全体が単一のワードとして
直接にコード化され、従来のように特定の英数字ワード
を構成する各文字をコード化する手法をとらない。従っ
て記憶スペースが少な(て済み、テキスト伝送時間も短
かくて済む。例えば、N個のワードを含む語業の組の場
合、Log2Nのビットを有する2進コードで以ってN
個のワードがコード化できる。1ワードあたり14ビツ
トを選択すれば、214即ち16,384個のワードか
ら成る語電の組が得られる。その語零の組の各ワードが
、各ワードの文字数に関係なく14ビツトから成るので
、このコード化技法を用いれば記憶スペースをかなり節
約できる。テキスト伝送時間も節約されよう。
速記文字の分野では、ワード全体又はワードの一部の速
記表示をコード化する例がある。しかし速記文字に関す
る従来の特許では、ワード全体のコード化について示唆
していない。速記文字の分野での記憶の主たる目的は、
ワードの速記文字表示を記憶することであって、ワード
そのものを記憶することではない。米国特許第3731
278号は、速記機器で発生される類の、音廟[、のワ
ード構成で使用されるものと類似の形態のデータを、コ
ンピュータに適用可能なフォーマットに変換するコンピ
ュータ・インターフェース装置を開示している。各デー
タ入力期間から形成されるコンピュータ・ワードは32
ピツトを含む。米国特許第3892915号及び同第4
041467号にも同様のコード化技法が開示される。
しかし、これらの従来例はいずれも、全体のワードに対
し一意的な単一の表示で以ってワード毎にコード化する
ことは開示していない。それらはむしろ、ワードを構成
する音声上の文字か又はワードを構成する音素の表示を
与えることによってコード化している。
従って本発明の目的は、情報処理システムのために改良
されたワード全体をコード化する技法を提供することに
ある。
本発明の他の目的は、入力された英数字ワードの独得の
単一の表示で動作する情報処理システムを提供すること
にある。
本発明の他の目的は、入力された英数字ワードの一意的
な単一の表示にその英数字ワード全体が直接コード化さ
れる情報処理システムを提供することにある。
本発明の他の目的は、選択的に決めた特定の語♀の組に
表われないワードについては、各文字毎にそれが1つの
ワードとして1つずつコード化される情報処理システム
を提供することにある。
本発明の他の目的は、情報処理システムに於いてデータ
記憶要求を節約し且つ伝送速度の能力を高めることにあ
る。
本発明の他の目的は、従来の文字入力装置で適用h「能
なワード・コードに基づ(システムを提供することにあ
る。
〔発明の概要〕
本発明は、ワード全体が一意的な単一の表示に直接にコ
ード化される情報処η1j装置に関する。そしてこのよ
うな一意的な単一の表示が、テキストの記憶及びテキス
トの伝送で使用される。
英数字ワードは文字単位で入力される。−慧的な単一の
表示はツリー検索論理技法で各ワードに与えられる。各
々の選択された語零の組は、それに関係する一意的なツ
リーを対応させており、そのツリー中の各文字はそのツ
リー中の一意的な位置を占める。そのシステムに1つの
ワードが人力されると、唯一の表示がそれに与えられる
。所与のntの組に含まれないワードは、各文字が1つ
のワードとしてシード化されるよう文字毎にコード化さ
れる。語蘭の組は、そのような・11の生じる可能性が
出来るだけ小さくなるよう選択される。
〔実施例の説明〕
第2図は、従来技法のワード処理7ステムを示すブロッ
ク図である。人力装置41かも1文字ずつそのシステム
へワードが入力される。この人力装置は、タイプライタ
か又はコンピュータ端末装置へのキーボードを一般に含
む。入力装置41はCRTディスプレイと結合されるラ
イトペンか又は感知用ペンと結合される抵抗性タブレッ
トかであって良い。ライトペンをCRT上の適宜選択さ
れた記号に接触させるか又は感知用ペンを抵抗性タブレ
ットLの適宜選択された所望の記号に接触させることに
よって、そのシステムにデータが入力される。どのよう
な入力装置が使用されても、そのデータ入力モードはそ
の情報をシステム中へ文字単位で入力することを必ず含
む。更にワード中の各記号毎の表示を逐次集めることに
よって英数字ワードが表わされる。
ここでワードとは、独立の用法で使用できる、より小さ
い単位に分割できない、成る意味を表わしそして伝える
1個の英数字文字又は英数字文字の組合せとして定義す
る。従って、数字の「8」、水の化学記号[H20J 
、疑問符の記号「?」及び言葉「come」などは全て
ここで定義したワードの例である。
入力装置41は、実際の英数字文字入力を伝送せずに、
そのような英数字文字を何らかの形で表わした表示を伝
送する。一般にこの表示は、2進数である。個々の英数
字文字を表わすのに使用される典型的なコードは7ビツ
トのASCIIコードである。この7ビツトのASCI
Iコートヲ用いると、一意的な7ビツト表示で以って2
7即ち128個の文字がコード化できる。キーボード上
の各英数字文字及び各制御1文字は一意的な7ビツト表
示によって表わされる。そのシステムへの各ワード入力
は、そのワード中の各文字毎の表示を逐次集めたものに
よって表わされる。この7ビツトのコードを用いて、l
”comeJというワードを表わすとすると、 「000001100011110001101000
0101」となる。°これは各文字の表示がド記の場合
である。
c     00000 1 1 o     0001111 m    0001101 e     0000101 開始終了コード発生器42が、ワードの初めに開始ピッ
トを、またワードの終りに終了ビットを置くことによっ
て各ワード全体を区切る。このシステムの中へ逐次入力
されている個々のワードを区切るには開始終了コードが
必要なのである。
開始終了コード検知器46が各ワードの開始ビット反び
終了ビットを検知し、制御論理装置44に、成るワード
を与えようとしていることを表わす信号を与える。制御
論理装置44で受取った各ワードは、ユーザが選択した
制御機能に応じて、記憶部45か、情報処理装置47へ
の伝送の為の伝送回路網46か又は出力装置51へつな
がる開始終了コード検知器49への線4日かへ出力され
ても良い。記憶部45に送られるワードは、ユーザによ
る編集や削除の目的から後で取出せる。出力装置51は
、グリンタやディスプレイ端末装置、例えばCRTやグ
ラズマ・ディスプレイでも良い。
情報処理システム47はそれ自体が記憶部と出力装置と
を有していても良い。
本発明の好適な実施例を第1図に示す。一連のワードが
、入力装置11によって1文字ずつそのシステムへ入力
される。開始終了コード発生器12が各ワード全体に対
して開始ビットと終了ビットとを付ける。そこで開始終
了コード検知器13が直流のビット・ストリームの各ワ
ードを区切る。
各ワードが線61を介してコード化器14に送られる。
開始終了コード検知器1ろはコード化器14に線62を
介してゲート信号ケ供給する。このゲート信号は、ワー
ドが伝送中であることをコード化器に知らせる。コード
化器14及びワードテーブル15の動作を、第4図に関
連して詳細に説明しよう。
線61(第1図も参照)を介してコード化器14(第4
図)に入力されるワードは、一時的ノ々ツファ65及び
ツリー検索論理装置66に向かって指向される一線61
でワードが入力されるのと同時に、ゲート信号が線62
を介して制御論理装置67に入力される。この信号は、
1ワードの開始及び終了を表わす。このゲート信村は、
それからツリー検索論理装置66へ線71を介してリレ
ーされる。この信号は、先ずこのツリー検索論理装置6
6に検索を開始するよう指示し、次にその検索が何時停
止されるべきかをそのツリー検索論理装置66に指示す
る。
ツリー検索論理装置66の動作を、第3図の論理シリ−
を用いて詳細に説明しよう。図示のように、「COme
」というワードはツリー検索論理装置に逐次に入力され
る。このツリーの第1のレベル52は文字「C」が見つ
かるまで検索される。
位置53でこれが見つかる。次のステップは、第2のレ
ベル54を検索することである。これは文字「o」がそ
のレベルで見つかるまで、即ち位置55で見つかるまで
行なわれる。次に、第3のレベル56が検索される。こ
れはそのワードの3番目の文字rmJが位置57で見つ
かるまで続けられる。そして最後にそのツリーの第4の
レベル58が検索される。これはそのワードの最後の文
字reJ  が位置59で見つかるまで行なわれる。こ
のワードツリーの位置59はワードテープ/L/1・5
14図も参照)の位置に対応する。ワードテーブル15
中のこの位置は、rcomeJというワード1全体に対
する一意的な表示を含む。
このシステムへの各文字入力と、ワードツリーの所与の
レベルの各位置との間に比較が為される。
この比較は、ツリー検索論理装置66の中の回路によっ
て行なわする。このツリー−ヒの各位置は、その対応す
る英数字文字を表わす7ピツトのASCIIコード表示
によって表わされる。1つのワードの最初の文字がツリ
ーへ入力されるとき、ツリー検索論理装置66が比較回
路に指示して、その文字を表わすASCIIコード表示
と、そのツリーの第1のレベル52上の全てのASCI
Iコード表示との間で比較を行なわせる。一致が生じる
とき、このツリー上の最初の文字が見つかる。
上記の実施例では、位置53で一致が生じる。この時点
で、ツリー検索論理装置66は、その最初に選択された
位置53の真下の第2のレベル54に比較回路を指向す
る。比較一致が生じるまで第2のレベル54での検索が
行なわれる。この過程は、入力されたワードがツリー上
で見つかってしまうか又は制御論理装置67が検索を止
めるよう信号を生じるまで続けられる。前述のとおり、
1つのワードの初めと終りを指示するため制御論理装置
67に線62を介してゲート信号が与えられる。成るワ
ードの終りが指示されてから所定時間後に、制御論理装
w67はツリー検索論理装置66に検索を停止させる信
号を与える。この信号を受取った時点で、一時的バッフ
ァ65がクリアされ、検索論理装置660入力がリセッ
トされ、次のワードの入力を待ち受ける。
ワードテーブル15中の各位置は、ワードツリー論理装
置中に一意的な位置を有する。「comejというワー
ドを表わすワードテーブル15中の位置に到達できる唯
一の方法は、ワードツリー論理装置の中に「comeJ
を入力することである。もしも[comeJというワー
ドを「cmoeJなどと誤って入力すると、そのツリー
上の位置59には到達せず、従ってワードテーブル中の
位置に対応するアドレス位置にも到達できない。ワード
ツリー中の各位置には夫々に一意的な次のぶら下りレベ
ルが対応づけられる。そのレベルを検索するための唯一
の方法は、そのレベルの真I−のツリー中の特定の位置
を通すことである。ワードテーブル15中で成るワード
を捜すだめの唯一の方法は、英数字の中味及びその順序
をワードツリーの中に間違いな(入力することである。
ワードテーブル15の中味はユーザによって予じめ決定
される。本発明の好適な実施例では、ワードテーブル中
の各ワードを表わすのに14ピツト使用される。この場
合、214即ち16,384個のワードを表わせる。各
ワードテーブルの中には、各英数字文字及びそのシステ
ムの中に入力できる各制御文字に対し14ビット表示が
含まれる。
成るユーザのために選択されたワードテーブルは、その
ユーザにとって最適のものにできる。例えば、化学者の
選択した語傘の組は、弁護士の選択したものとはかなり
異なるであろう。
前述のとおり、ツリー検索論理装置へのワードの入力を
示すだめのゲート信号が制御論理装置からツリー検索論
理装置へ線71(第4図参照)を介して送られる。同様
に、ツリー検索論理装置へ入力される特定のワードの終
りを表わすゲート信号t′1八「Δ連歌て送jら「起b
’6oそのツリー上になく、従ってワードテーブル15
にもないワードがツリー検索論理装置66に入力された
場合は、ツリー検索論理装置66から制御論理装置67
へ線72を介して1つの信号が送られる。この信号は、
その入力されたワードに対応する表示が見つからなかっ
たことを、制御論理装置67に示す。
そのワードの終りを示す第2の信号が線71を介して送
られるとき、ラッチ(図示せず)がそのツリー検索論理
装置66に送られる。入力されたワードがツリー上で見
つけられる場合は、そのラッチがリセットされ、ワード
ツリー中のそのワードのアドレスがワードテーブル15
に送られる。しかし、ツリー検索論理装置66中の如上
のラッチがセットされてから所定の時間内に、そのツリ
ー上でそのワードが見つからなければ、ツリー上にワー
ドが見つからなかったことを表わす信号が、線72を介
して制御論理装置67へ送られる。このことが生じると
き、1つの信号が制御論理装置67から線75を介して
6時的バツファ65に送られる。一時的バッファ65は
線61で屓初に入力されたそのワードを含んでいる。制
御論理装置67は、一時的バッファ65にその中から−
・時に一文字ずつツリー検索論理装置66へ送るよう指
示する。1つのワードの初めと終りとに対応する開始信
号及び終了信号は、その場合、一時的バッファ65から
ツリー検索論理装置66へ各文字の入力毎に、線71を
介してツリー検索論理装置66へ送られる。この様にし
て、そのワードを構成する各文字は、そのツリーの第1
のレベル52(第3図も参照)上の、ワードテーブル1
5中の一意的な位置に対応する位置で見つけられる。1
つのワードが一文字ずつコード化される必要がある場合
、そのワードの表示は14ビツトと、そのワードに含ま
れる文字の数との積のビット数で表わされる。従って、
例えばワードテーブル15中に「camelというワー
ドが見つからなかった場合は、56ビツトの情報がその
ワードを表わすのに必要となろう。ワードテーブル15
中でワードを適宜選択できれば、個別の文字コードで入
力されるワードを与える可能性が小さくなる。
このようにして得られたワード表示は全て、ワードテー
ブル15から線64を介して出力される。
テーブル中で見つかったワードの場合は14ビツト表示
が線64を介して出力され、テーブル中で見つからなか
ったワードの場合は各文字毎の14ビツト表示がこれも
線64を介して出力される。
しかし、その出力表示がコード化器14から線16又は
17を介して出力するのを制御論理装置67が制御する
。スイッチ69が通常は閉位置にあり、そのスイッチ6
9で制御される線17を介して、ワードテーブル中で見
つかったワードの表示が送られる。通常は開いているス
イッチ68が線16を制御するが、この線16はワード
テーブル中で見つからなかったワードの表示を送る。即
ち線61を介して入力されたワードがツリー検索論理装
置66で見つからなかったことを表わす信号がs *’
制御論理装置67から線73を介して6時的バツファ6
5に送られた場合、スイッチ69を開き且つスイッチ6
8を閉じるための信りが線74を介して送られる。この
様にし7て、ワードテーブル15で見つかったワードの
表示が線17を介して送られるのに対し、ワードテーブ
ル15で見つからなかったワードの表示即ち一時に一文
字ずつコード化されたワードの表示は線16を介して送
られる。
線16を介して送られる1つの所与のワードに相当する
、複数の文字から成る表示は直列化器18(第1図参照
)に入力され、そこで個々の文字ビットがワード全体を
表わすよう直列化される。
従って、例えば、「COme」というワードがワードツ
リーの中になければ、 rcJ、「O」、「m、1、「
e」  という文字に対する4個の14ビツト表示が線
16を介して直列化器18に送られる。この時点で、 
rcomeJというワードに対して1個の56ビツト表
示の中にこの4個の14ビツト表示が逐次に集成される
。この56ビツト表示はその後、フラグピット発生器1
9に入力され、そこで1つのワードの初めを指示するた
めのフラグビツトをその56ビツト表示の最初に付ける
。同様に、線17を介して送られたワードの14ビツト
表示に対しても、その新しいワードの初めを明らかにす
るためフラグビット発生器19でその14ビツト表示の
初めにフラグビットを付ける。
フラグビットを付けられた各入力ワードの一意的な表示
が、制御論理装置21に入力される。この時点で、その
一意的な表示は、記憶部22か、伝送回路網2!1か、
又は線25を経て出力装置66かへ送られることができ
る。記憶部22へ送られたワード表示は、後で編集や削
除のため取出し得る。語♀の組を各ユーザにとって最適
なものとすることにより、14ビツト表示で表わされる
ワードの数は最も評価される。こうすることにより、各
ワードがそのワードを構成する文字毎にコード化されて
いた場合よりも、記憶部22に収容できるワードの数は
多くできる。斯して所与のワードあたりの記憶コストは
著しく低くなる。
制御論理装置21に入力された各ワードは、他の情報処
理システム24へ伝送するための伝送回路網23に指向
されても良い。ユーザ4J1に最適のワードテーブルを
提供することにより、ユーザが他の情報処理システム2
4と通(Nし1(1・る速)口“が高くなる。このよう
に速度が高くなるのは、成るシステムから別のシステム
へ伝送しなければならないビットの数が少なくて済むか
らである。
入力されたワード表示を制鉤診埋装都′21が受取った
ときに生じ拐るも51つの送り先は、その表示が表わす
ワードに解読して、ユーザに表示するための回路である
。前述のとおり、出力装置66は、プリンタでも、CR
Tティスゲレイでも、プラズマ・ディスグレイでも良い
。ワードを表わす個別の表示は、線25を介してフラグ
・ビット検知器26に入力される。フラグ・ビット検知
器26は、フラグ・ビットを検知し、従ってワードの始
めを検知する。成るワードが検知されたとき、送られて
きた次のデータのストリームを表わす信号がビット・カ
ウンタ27に送られる。このビット・ストリームがビッ
ト・カウンタ27に人力されるとき、ビットの数が計数
される。ビット・カウンタ27中の判断回路(図示せず
)が、ビット・カラ/り27へ入力されたビット数に従
ってそのビット・ストリームを適当な線に指向する。そ
のビット数が14に等しくなるとき、そのビットストリ
ームが#29を介してデコーダ52へ入力される。しか
し、もしもそのビット・ストリームに含まれるビットの
数が14に等しくなげれば、これはその特定のワードの
表示が文字毎にコード化されたものであることを示す。
このことが生じると、14ビツトよりも大きいビットの
ワードを表わす直列のビットストリームは線28を介し
て並列化器!+1に入力される。並列化器61は、その
14ビツトのパケット群に分離し、それらのパケット群
を線30を介し一時に1パケツトずつデコーダ32に出
力する。
デコーダ32及びワード・テーブル36の動作を、第5
図に沿って詳細に説明しよう。
線30を介して制御論理装置75へ入力されるデータは
、1ワード中に夫々14ビツトの個別の文字、複数個か
ら成る形態をしている。制御論理装置75に線29を介
して入力されるデータは、ワード全体を表わす14ビツ
トa示の形態をとる。
線30を介して最初の14ビツト・パケットが制御論理
装置75で受取られるとき、1ワードの初めを弄わす信
号が線77を介して開始終了コード発生器64に送られ
る。このワード・テーブルは、各々の14ビツト表示を
、その出力装置で使用できるような7ピツトのASCI
I表示に対応(マツチング)させる。各14ビツト文字
表示が識別されるにつれて、線82を介し、7ピツトの
ASCIIコードが開始終了コード発生器34に送られ
る。1つのワード中の最後の文字を表わす14ビツト・
パケットを匍J Wi’ll論理装[75で受取ると、
そのワード中の最後の文字を受取ったことを表わす信号
が線77火介して開始終了コード発生器34に送られる
。、斯して、デコーダ′52へmlろOを介して入力さ
れる各ワードに与えられたASCIIコード表示には、
開始終了ビットを付けることができる。このASCII
コード表示は、7ピツトにワード中の文字数を乗じた数
のビット数のものになろう。
線29を介して制御論理装置75へ入力されるデータは
、ワード全体が14ピツト表示の形である。11iIi
29を介して制御論理装置75で各々の14ピツト表示
を受取るとき、新しいワードを受取ったことを表わす信
号が線77を介し開始終了コード発生器′54に送られ
る。線29から制御論理装置75で受取った1つのワー
ドの終りを表わすも51つの信号が、最初の信号を受取
ってから所定の時間後に送られる。線29かも制御論理
装置75で受取ったその14ピツト表示は、そこで線7
9を介してワードテーブル33へ指向される。
ワードテーブル63は、到来する14ピツトのワード表
示を7ビツト・コードのASCII表示に対応(マツチ
ング)させる。このASCIIコード表示は線81を介
して並列化器76に出力される。並列化器76はそのA
SCIIコード表示を分離して、その特定のワードをそ
のワード中の個別の文字を表わす7ビツト・パケット群
にする。
この7ビツトのASCIIコード・パケットは線83を
介して開始終了コード発生器34に送られる。開始終了
コード発生器34には、ワードが解読されようとし、し
かも該発生器64に入力されようとしていることを表わ
す信号が線77で既に与えられている。その特定のワー
ドのだめの最初の文字コード表示の前に開始ビットがイ
・1げられ、そしてそのワードの最後の文字のだめの最
後の7ビツトのASCIIコード表示の後に終了ビット
が付けられる。
制御論理装置75は、デコーダ32へのワード入力が線
30かもか又は線29からかに依って線81か又は線8
2にワードテーブル33の出力を指向するよう作用する
。線60かものワードは一時に一文字ずつで送られて来
るワードを示すことは既に述べたとおりである。この場
合、ワードテーブル33からの出力が線81ではな(線
82を介して送られるようスイッチ84を開き、スイッ
チ85を閉じさせる信号を制に11論理装置75が線7
8を介して送る。スイッチ84は、通常は閉位置にある
。スイッチ85は、そのワードが線82を介して送られ
るに足る時間だけ閉じている。デコーダ62への入力が
線29からの場合は、デコーダ32へ入力されているの
がワード全体を表わす表示であることを示す訳だから、
スイッチ84が既に閉じたままでもあるし、線81を介
してそのワードが送られることになる。
各ワード表示が、そのワードの各文字を表わすASCI
Iコード表示に解読され、そのワード全体に対するAS
CIIコード表示に開始ビット及び終了ビットが付けら
れた後、そのデータは開始終了コード検知器35を経て
出力装置36′に送られる。開始終了コード検知器35
は、その出力装置′56がASCIIコード表示の英数
字表示を発生し得るようワード全体を識別する。前述の
ように、出力装置36はプリンタでもディスプレイでも
良い。
ワードテーブル15中のワードコード表示の選択は、全
く恣意的である。その表示は、英数字の中味や英数字の
順序に依存しない。テーブル15中のワードは、1つの
ワードを構成する個別の文字のコードの配列や数学的な
加魚によって構[I(:されるものではない。この割当
て方法は、英数字の同一の内容を有するが、その順序が
異なるというワードがそのシステムで確実に混同される
ことのないようにj7ている。テーブル36中のワード
コード表示は、テーブル15中のものと同じものにしで
ある。
ここでは1ワードあたり14ピツトを選択したが、これ
は説明の便宜上のものである。ここで開示したようなシ
ステムを、1ワードあたり14ピツトという一意的な単
一表示に限定する必要はない。また、Huffman 
 コード化方式やワード発生頻度コード化技法など他の
周知のコード化方式を本発明のシステムで使用できる。
【図面の簡単な説明】
第1図は、本発明のワード処理システムの全体的なブロ
ック図である。第2図は、従来技法のワード処理システ
ムのブロック図である。2+’、’ 3図は、好適な実
施例のコード化ツリーの説明図である。 第4図は、本発明のコード化部で使用されるコード化器
の詳細なブロック図である。そして第5図は、本発明の
解読部で使用されるコード化器の詳細なブロック図であ
る。 11・・・・入力装置、14・・・・コード化器、21
・・・・制御論理装置、24・・・・情報処理システム
。 出願人  インタ慴ル・ビジネス・ナンズ・コづ悼々→
タン代理人 弁理士  山   本   仁   朗(
外1名)

Claims (1)

  1. 【特許請求の範囲】 英数字ワードをそのシステムに入力するための手段と、 該ワードの英数字の内容及びその順序に関係しない一意
    的な単一の表示に上記各英数字ワードを対応させるため
    のコード化手段と、 その対応する英数字ワードの代りに上記表示をワード・
    プロセシング装置に指向させるための制御論理子pと を具備する情報処理システム。
JP57182223A 1981-12-31 1982-10-19 情報処理システム Pending JPS58119032A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US336193 1981-12-31
US06/336,193 US4500955A (en) 1981-12-31 1981-12-31 Full word coding for information processing

Publications (1)

Publication Number Publication Date
JPS58119032A true JPS58119032A (ja) 1983-07-15

Family

ID=23314967

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57182223A Pending JPS58119032A (ja) 1981-12-31 1982-10-19 情報処理システム

Country Status (4)

Country Link
US (1) US4500955A (ja)
EP (1) EP0083420B1 (ja)
JP (1) JPS58119032A (ja)
DE (1) DE3277039D1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009266244A (ja) * 2002-07-03 2009-11-12 2012244 オンタリオ インコーポレイテッド 簡潔言語学データを生成かつ使用するシステムおよび方法

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61500345A (ja) * 1983-10-19 1986-02-27 テキスト サイエンセズ コ−ポレ−シヨン デ−タ圧縮方法および装置
JPH067397Y2 (ja) * 1984-07-30 1994-02-23 カシオ計算機株式会社 文書入力装置
FR2569883B1 (fr) * 1984-09-05 1989-11-17 Sharp Kk Dictionnaire electronique destine a etre utilise dans un systeme de traitement de texte en francais
FR2572834B1 (fr) * 1984-11-05 1987-03-27 Inchauspe Louis Procede multipliant par environ deux la capacite de memorisation des ordinateurs et divisant d'autant le temps de transmission d'informations entre ordinateurs
US4807181A (en) * 1986-06-02 1989-02-21 Smith Corona Corporation Dictionary memory with visual scanning from a selectable starting point
AU603453B2 (en) * 1987-05-25 1990-11-15 Megaword International Pty. Ltd. A method of processing a text in order to store the text in memory
US5553283A (en) * 1987-05-26 1996-09-03 Xerox Corporation Stored mapping data with information for skipping branches while keeping count of suffix endings
US5754847A (en) * 1987-05-26 1998-05-19 Xerox Corporation Word/number and number/word mapping
US5224038A (en) * 1989-04-05 1993-06-29 Xerox Corporation Token editor architecture
DE4015420A1 (de) * 1990-05-14 1991-11-21 Bosch Gmbh Robert Verfahren zur datenkompression
JP3278297B2 (ja) * 1994-07-20 2002-04-30 富士通株式会社 データ圧縮方法及びデータ復元方法並びにデータ圧縮装置及びデータ復元装置
JP2766875B2 (ja) * 1995-04-10 1998-06-18 日本ピラー工業株式会社 軸封システム装置
JP3305191B2 (ja) * 1996-03-19 2002-07-22 富士通株式会社 文書管理装置及びデータ圧縮方法及びデータ復元方法
US5737735A (en) * 1996-05-14 1998-04-07 Resolve 2000, Inc. Method and apparatus for recording and reading date data having coexisting formats
US5907566A (en) * 1997-05-29 1999-05-25 3Com Corporation Continuous byte-stream encoder/decoder using frequency increase and cyclic redundancy check
DE19854179A1 (de) * 1998-11-24 2000-05-25 Siemens Ag Verfahren und Anordnung zur Kompression bzw. Expansion von Zeichenketten durch eine DV-Einrichtung
US7274671B2 (en) * 2001-02-09 2007-09-25 Boly Media Communications, Inc. Bitwise adaptive encoding using prefix prediction
JP2006510989A (ja) * 2002-12-27 2006-03-30 ノキア コーポレイション 移動通信端末の予測テキスト入力及びデータ圧縮方法
KR100716610B1 (ko) * 2005-06-23 2007-05-09 노키아 코포레이션 이동통신단말기를 위한 예측 텍스트 엔트리 및 데이터압축방법
US8105223B2 (en) 2008-05-07 2012-01-31 Smurfit-Stone Container Enterprises, Inc. Machine and method for forming reinforced polygonal containers from blanks
US11636100B2 (en) * 2020-11-27 2023-04-25 Verizon Patent And Licensing Inc. Systems and methods for compression-based search engine

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BE779437Q (fr) * 1969-06-27 1972-06-16 Univ Oklahoma Research Inst Traitement d'informations generales
US3731278A (en) * 1970-02-09 1973-05-01 Stenographic Machies Inc Format conversion system
US3644898A (en) * 1970-04-30 1972-02-22 United Aircraft Corp Information association through logical functions derived from language
US3717851A (en) * 1971-03-03 1973-02-20 Ibm Processing of compacted data
US3892915A (en) * 1973-12-10 1975-07-01 Transcripts Inc Stenographic data recording apparatus and method
US3980994A (en) * 1975-02-27 1976-09-14 Atex, Incorporated Text editing and display system having text insert capability
US3995254A (en) * 1975-07-16 1976-11-30 International Business Machines Corporation Digital reference matrix for word verification
US4041467A (en) * 1975-11-28 1977-08-09 Xerox Corporation Transcriber system for the automatic generation and editing of text from shorthand machine outlines
JPS5335434A (en) * 1976-09-13 1978-04-01 Lexicon Corp Information processor
US4193119A (en) * 1977-03-25 1980-03-11 Xerox Corporation Apparatus for assisting in the transposition of foreign language text
US4159536A (en) * 1977-04-08 1979-06-26 Willard E. Kehoe Portable electronic language translation device
US4389636A (en) * 1980-11-03 1983-06-21 Riddle H S Jun Encoding/decoding syncronization technique

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009266244A (ja) * 2002-07-03 2009-11-12 2012244 オンタリオ インコーポレイテッド 簡潔言語学データを生成かつ使用するシステムおよび方法
US7809553B2 (en) 2002-07-03 2010-10-05 Research In Motion Limited System and method of creating and using compact linguistic data

Also Published As

Publication number Publication date
EP0083420A2 (en) 1983-07-13
US4500955A (en) 1985-02-19
EP0083420B1 (en) 1987-08-19
DE3277039D1 (en) 1987-09-24
EP0083420A3 (en) 1984-08-22

Similar Documents

Publication Publication Date Title
JPS58119032A (ja) 情報処理システム
EP0083393B1 (en) Method of compressing information and an apparatus for compressing english text
US6094634A (en) Data compressing apparatus, data decompressing apparatus, data compressing method, data decompressing method, and program recording medium
TW391116B (en) High-speed serial data communication system
KR870008446A (ko) 2진 데이타 압축·신장 처리 장치
JPS60140981A (ja) 符号語システムのデジタル符号語を復号する方法および装置
JP2818936B2 (ja) 2進データ処理方法および回路
JP2737283B2 (ja) 無線選択呼出受信機
JPS6268325A (ja) 文章圧縮・伸展方式
JPS5848180A (ja) 文字判定処理方式
JPS5958971A (ja) 符号化回路
JPH0365588B2 (ja)
JPH0410104B2 (ja)
JP2548272B2 (ja) 可変長符号化コード復号装置
JPS59177636A (ja) 文字入力処理装置
JPS61148556A (ja) 通信制御装置の制御コ−ド検出装置
JPS58117024A (ja) カナ文字入力処理方式
JPS59221732A (ja) カナ漢字変換処理装置
JPS6410865B2 (ja)
JPH047734A (ja) 文字処理装置
US3484750A (en) Statistical encoding
JPH10326273A (ja) データ圧縮装置及びデータ復元装置及びデータ圧縮方法及びデータ復元方法及びプログラム記録媒体
JPS5896376A (ja) 日本語入力装置
JPH0644218A (ja) 文書作成装置及びこの装置に用いられる変換制御方法
JPS58214185A (ja) 電子語学学習機