JPS5844574A - 日本語文章処理方式 - Google Patents

日本語文章処理方式

Info

Publication number
JPS5844574A
JPS5844574A JP56142928A JP14292881A JPS5844574A JP S5844574 A JPS5844574 A JP S5844574A JP 56142928 A JP56142928 A JP 56142928A JP 14292881 A JP14292881 A JP 14292881A JP S5844574 A JPS5844574 A JP S5844574A
Authority
JP
Japan
Prior art keywords
data
sentence
fed
speech
japanese
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP56142928A
Other languages
English (en)
Inventor
Tomonori Suda
須田 智紀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP56142928A priority Critical patent/JPS5844574A/ja
Publication of JPS5844574A publication Critical patent/JPS5844574A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本−発明は日本語文章地理方式に係り、・特に日本一の
文章データを品詞分解することによりデータを圧縮パシ
、蓄積または転送などの処理効率を101よさせる方式
に関する。
従来1日本語文章処理刃式は、文学データを漢字1文字
ごとにふられ沈思バイトの漢字コードの列として表わし
てい友。しかし、8バイトコードでは約@tooo種の
ものが表わせるのに、遡゛帛の文章データで関われる漢
字の種類はzooo芋8直で、コード系としてはきわめ
てすきまが多く、蓄積または転送の効率が悪いという欠
点があっ友。
本発明は前記欠点を解消し1日本語文章データを文学単
位でなく、ある法則にもとづいて分解された文字列単位
にコード化し、蓄積、転送の効率を高めることを目的と
する。
この目的は日本語文章を人力して1sstaは転送する
システムにおいて、人力さnた日本語文章を品詞に分類
し、該分類さtL次品詞を一コード化するデータ圧縮手
段及び前記コード化されたデータから日本語文章を生成
する日本語文章生成手段を設けたことを特徴とする日本
語文章地理方式により達成される。
以下図面を用いて本発明の詳細な説明する〇第1図は本
発明の一実施例を示す全体ブロック図である。図におい
て、lはデータ入力装置、2は入力?1III@J都、
畠はデータ圧縮部、慟はデータ処理部、6はデータ出力
装置、6は出力側#部、7はデータ伸長部、8は7アイ
ル、9は通値IgI#である。lIはデータ圧縮手段、
7は日本一文章生成手段ともいう。
gs図は本発明の一実施例を示す品詞の〃−ド化を示す
図である。図において、10は品−」、11はコード長
(ビット)、13は第l−巣番ビット値、18は第5ビ
ツト以降の臘である。
さて、データ入力装置lより入力され九日本語文章デー
タは、−就入力Iv制御部2の中に畜わ見られ次後、デ
ータ圧縮部8に入力される。該データ圧m部8では、ま
ず文章データを名詞、動詞、助詞等に品詞分解した後、
第3図の様にコード化する。例えば名詞はコード長11
がIAOビットで第1〜第4ビツトの埴18が1001
で第5〜第30ピツトに通番を付けである。このt[し
て日本語文章は[コード列となる。
次にコード化されたデータはデータ処MA品慟に送られ
、ここで蓄積、転送等の処理を行なう。また文章データ
を出力装置5に出力する揚台は、データ伸′長s7にお
いて、前記圧li1部8においてコード化されたデータ
から1!I]記コ一ド列に従って文字夕1への変換が行
なわれ、出力線6から文章データが取出される。
以上説明したように、本発明によれば、文章データを大
幅に圧縮し、データの見埋効4を鍋め。
DA8Dや通信回−などの資#Ift効率よくに用でき
るという効果がある@
【図面の簡単な説明】
第1図は本発明の一実施例を示す全体ブロック図である
。Mz図は本発明の一実施例を示す品詞コード化を示す
図である。 一記号の説明 1−・・・・・データ入力装置、ト・・
・・・入力側ag、a’・・・・・データ圧縮部、会・
・・、・メ・データ処ms1ト・・・・・データ出力装
置、6・・・・・・出力側#邸、7・・・・・・データ
伸長部、8・・・・・・ファイル、9・・・・・・通信
Lg1111% lO・・・・・・品詞、11・・・・
・・コード長(ピット)・

Claims (1)

    【特許請求の範囲】
  1. 日本#父電を入力して処理または転送するシステムにお
    いて、入力され次日本語文章を品詞に分類し、該分類さ
    れた品詞をコード1とするデータ圧縮手段及び前記コー
    ド化されたデータから日本語文章を生成する日本語文章
    生成手段′freけたことを#倣とする日本語文章処理
    方式。
JP56142928A 1981-09-10 1981-09-10 日本語文章処理方式 Pending JPS5844574A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56142928A JPS5844574A (ja) 1981-09-10 1981-09-10 日本語文章処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56142928A JPS5844574A (ja) 1981-09-10 1981-09-10 日本語文章処理方式

Publications (1)

Publication Number Publication Date
JPS5844574A true JPS5844574A (ja) 1983-03-15

Family

ID=15326889

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56142928A Pending JPS5844574A (ja) 1981-09-10 1981-09-10 日本語文章処理方式

Country Status (1)

Country Link
JP (1) JPS5844574A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH024831U (ja) * 1988-06-22 1990-01-12

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH024831U (ja) * 1988-06-22 1990-01-12

Similar Documents

Publication Publication Date Title
EP3276507B1 (en) Encoding device, encoding method and search method
JPH09511372A (ja) 符号・復号器用圧縮ソースコーディング表
CN110688857A (zh) 一种文章生成的方法和装置
JPS58119032A (ja) 情報処理システム
CN115840799B (zh) 一种基于深度学习的知识产权综合管理系统
Cao et al. Referring expression generation using entity profiles
CN114610903A (zh) 一种文本关系抽取方法、装置、设备以及存储介质
CN101388731B (zh) 一种低速率等效语音水声通信技术
JPS5844574A (ja) 日本語文章処理方式
JPH05266069A (ja) 中国語と日本語との間の双方向機械翻訳方式
JPS57117068A (en) Document processor
KR100326634B1 (ko) 문서정보격납장치,문서정보격납방법,문서정보검색장치및문서정보검색방법
JPS58184646A (ja) メツセ−ジ通信方式
JPS54139356A (en) Kana-chinese character converter
JP4953145B2 (ja) 文字列データ圧縮装置及びその方法並びに文字列データ復元装置及びその方法
CN116032292A (zh) 一种基于翻译文件的大数据高效存储方法
JPH0554077A (ja) 単語辞書検索装置
JPS5822434A (ja) 日本語文章処理システム
JPH1185758A (ja) 意思伝達方法及び意思伝達システム
JP2004013680A (ja) 文字コード圧縮・復元装置および同方法
JPS60241157A (ja) 電子辞書を利用した文章デ−タ圧縮方法
STEFFENS Computer Data Compression
JPH067341B2 (ja) 音声合成方法
CN119600991A (zh) 一种语义通信方法、系统、计算机设备及存储介质
JPS61232724A (ja) 文字コ−ドデ−タの圧縮方式