JPS5844574A - 日本語文章処理方式 - Google Patents
日本語文章処理方式Info
- Publication number
- JPS5844574A JPS5844574A JP56142928A JP14292881A JPS5844574A JP S5844574 A JPS5844574 A JP S5844574A JP 56142928 A JP56142928 A JP 56142928A JP 14292881 A JP14292881 A JP 14292881A JP S5844574 A JPS5844574 A JP S5844574A
- Authority
- JP
- Japan
- Prior art keywords
- data
- sentence
- fed
- speech
- japanese
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
本−発明は日本語文章地理方式に係り、・特に日本一の
文章データを品詞分解することによりデータを圧縮パシ
、蓄積または転送などの処理効率を101よさせる方式
に関する。
文章データを品詞分解することによりデータを圧縮パシ
、蓄積または転送などの処理効率を101よさせる方式
に関する。
従来1日本語文章処理刃式は、文学データを漢字1文字
ごとにふられ沈思バイトの漢字コードの列として表わし
てい友。しかし、8バイトコードでは約@tooo種の
ものが表わせるのに、遡゛帛の文章データで関われる漢
字の種類はzooo芋8直で、コード系としてはきわめ
てすきまが多く、蓄積または転送の効率が悪いという欠
点があっ友。
ごとにふられ沈思バイトの漢字コードの列として表わし
てい友。しかし、8バイトコードでは約@tooo種の
ものが表わせるのに、遡゛帛の文章データで関われる漢
字の種類はzooo芋8直で、コード系としてはきわめ
てすきまが多く、蓄積または転送の効率が悪いという欠
点があっ友。
本発明は前記欠点を解消し1日本語文章データを文学単
位でなく、ある法則にもとづいて分解された文字列単位
にコード化し、蓄積、転送の効率を高めることを目的と
する。
位でなく、ある法則にもとづいて分解された文字列単位
にコード化し、蓄積、転送の効率を高めることを目的と
する。
この目的は日本語文章を人力して1sstaは転送する
システムにおいて、人力さnた日本語文章を品詞に分類
し、該分類さtL次品詞を一コード化するデータ圧縮手
段及び前記コード化されたデータから日本語文章を生成
する日本語文章生成手段を設けたことを特徴とする日本
語文章地理方式により達成される。
システムにおいて、人力さnた日本語文章を品詞に分類
し、該分類さtL次品詞を一コード化するデータ圧縮手
段及び前記コード化されたデータから日本語文章を生成
する日本語文章生成手段を設けたことを特徴とする日本
語文章地理方式により達成される。
以下図面を用いて本発明の詳細な説明する〇第1図は本
発明の一実施例を示す全体ブロック図である。図におい
て、lはデータ入力装置、2は入力?1III@J都、
畠はデータ圧縮部、慟はデータ処理部、6はデータ出力
装置、6は出力側#部、7はデータ伸長部、8は7アイ
ル、9は通値IgI#である。lIはデータ圧縮手段、
7は日本一文章生成手段ともいう。
発明の一実施例を示す全体ブロック図である。図におい
て、lはデータ入力装置、2は入力?1III@J都、
畠はデータ圧縮部、慟はデータ処理部、6はデータ出力
装置、6は出力側#部、7はデータ伸長部、8は7アイ
ル、9は通値IgI#である。lIはデータ圧縮手段、
7は日本一文章生成手段ともいう。
gs図は本発明の一実施例を示す品詞の〃−ド化を示す
図である。図において、10は品−」、11はコード長
(ビット)、13は第l−巣番ビット値、18は第5ビ
ツト以降の臘である。
図である。図において、10は品−」、11はコード長
(ビット)、13は第l−巣番ビット値、18は第5ビ
ツト以降の臘である。
さて、データ入力装置lより入力され九日本語文章デー
タは、−就入力Iv制御部2の中に畜わ見られ次後、デ
ータ圧縮部8に入力される。該データ圧m部8では、ま
ず文章データを名詞、動詞、助詞等に品詞分解した後、
第3図の様にコード化する。例えば名詞はコード長11
がIAOビットで第1〜第4ビツトの埴18が1001
で第5〜第30ピツトに通番を付けである。このt[し
て日本語文章は[コード列となる。
タは、−就入力Iv制御部2の中に畜わ見られ次後、デ
ータ圧縮部8に入力される。該データ圧m部8では、ま
ず文章データを名詞、動詞、助詞等に品詞分解した後、
第3図の様にコード化する。例えば名詞はコード長11
がIAOビットで第1〜第4ビツトの埴18が1001
で第5〜第30ピツトに通番を付けである。このt[し
て日本語文章は[コード列となる。
次にコード化されたデータはデータ処MA品慟に送られ
、ここで蓄積、転送等の処理を行なう。また文章データ
を出力装置5に出力する揚台は、データ伸′長s7にお
いて、前記圧li1部8においてコード化されたデータ
から1!I]記コ一ド列に従って文字夕1への変換が行
なわれ、出力線6から文章データが取出される。
、ここで蓄積、転送等の処理を行なう。また文章データ
を出力装置5に出力する揚台は、データ伸′長s7にお
いて、前記圧li1部8においてコード化されたデータ
から1!I]記コ一ド列に従って文字夕1への変換が行
なわれ、出力線6から文章データが取出される。
以上説明したように、本発明によれば、文章データを大
幅に圧縮し、データの見埋効4を鍋め。
幅に圧縮し、データの見埋効4を鍋め。
DA8Dや通信回−などの資#Ift効率よくに用でき
るという効果がある@
るという効果がある@
第1図は本発明の一実施例を示す全体ブロック図である
。Mz図は本発明の一実施例を示す品詞コード化を示す
図である。 一記号の説明 1−・・・・・データ入力装置、ト・・
・・・入力側ag、a’・・・・・データ圧縮部、会・
・・、・メ・データ処ms1ト・・・・・データ出力装
置、6・・・・・・出力側#邸、7・・・・・・データ
伸長部、8・・・・・・ファイル、9・・・・・・通信
Lg1111% lO・・・・・・品詞、11・・・・
・・コード長(ピット)・
。Mz図は本発明の一実施例を示す品詞コード化を示す
図である。 一記号の説明 1−・・・・・データ入力装置、ト・・
・・・入力側ag、a’・・・・・データ圧縮部、会・
・・、・メ・データ処ms1ト・・・・・データ出力装
置、6・・・・・・出力側#邸、7・・・・・・データ
伸長部、8・・・・・・ファイル、9・・・・・・通信
Lg1111% lO・・・・・・品詞、11・・・・
・・コード長(ピット)・
Claims (1)
- 日本#父電を入力して処理または転送するシステムにお
いて、入力され次日本語文章を品詞に分類し、該分類さ
れた品詞をコード1とするデータ圧縮手段及び前記コー
ド化されたデータから日本語文章を生成する日本語文章
生成手段′freけたことを#倣とする日本語文章処理
方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56142928A JPS5844574A (ja) | 1981-09-10 | 1981-09-10 | 日本語文章処理方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP56142928A JPS5844574A (ja) | 1981-09-10 | 1981-09-10 | 日本語文章処理方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS5844574A true JPS5844574A (ja) | 1983-03-15 |
Family
ID=15326889
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP56142928A Pending JPS5844574A (ja) | 1981-09-10 | 1981-09-10 | 日本語文章処理方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS5844574A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH024831U (ja) * | 1988-06-22 | 1990-01-12 |
-
1981
- 1981-09-10 JP JP56142928A patent/JPS5844574A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH024831U (ja) * | 1988-06-22 | 1990-01-12 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP3276507B1 (en) | Encoding device, encoding method and search method | |
| JPH09511372A (ja) | 符号・復号器用圧縮ソースコーディング表 | |
| CN110688857A (zh) | 一种文章生成的方法和装置 | |
| JPS58119032A (ja) | 情報処理システム | |
| CN115840799B (zh) | 一种基于深度学习的知识产权综合管理系统 | |
| Cao et al. | Referring expression generation using entity profiles | |
| CN114610903A (zh) | 一种文本关系抽取方法、装置、设备以及存储介质 | |
| CN101388731B (zh) | 一种低速率等效语音水声通信技术 | |
| JPS5844574A (ja) | 日本語文章処理方式 | |
| JPH05266069A (ja) | 中国語と日本語との間の双方向機械翻訳方式 | |
| JPS57117068A (en) | Document processor | |
| KR100326634B1 (ko) | 문서정보격납장치,문서정보격납방법,문서정보검색장치및문서정보검색방법 | |
| JPS58184646A (ja) | メツセ−ジ通信方式 | |
| JPS54139356A (en) | Kana-chinese character converter | |
| JP4953145B2 (ja) | 文字列データ圧縮装置及びその方法並びに文字列データ復元装置及びその方法 | |
| CN116032292A (zh) | 一种基于翻译文件的大数据高效存储方法 | |
| JPH0554077A (ja) | 単語辞書検索装置 | |
| JPS5822434A (ja) | 日本語文章処理システム | |
| JPH1185758A (ja) | 意思伝達方法及び意思伝達システム | |
| JP2004013680A (ja) | 文字コード圧縮・復元装置および同方法 | |
| JPS60241157A (ja) | 電子辞書を利用した文章デ−タ圧縮方法 | |
| STEFFENS | Computer Data Compression | |
| JPH067341B2 (ja) | 音声合成方法 | |
| CN119600991A (zh) | 一种语义通信方法、系统、计算机设备及存储介质 | |
| JPS61232724A (ja) | 文字コ−ドデ−タの圧縮方式 |