JPS635792B2 - - Google Patents

Info

Publication number
JPS635792B2
JPS635792B2 JP57048353A JP4835382A JPS635792B2 JP S635792 B2 JPS635792 B2 JP S635792B2 JP 57048353 A JP57048353 A JP 57048353A JP 4835382 A JP4835382 A JP 4835382A JP S635792 B2 JPS635792 B2 JP S635792B2
Authority
JP
Japan
Prior art keywords
kanji
information
auxiliary
text
accent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP57048353A
Other languages
English (en)
Other versions
JPS58165143A (ja
Inventor
Yasushi Ashikaga
Yasuo Sato
Tooru Kanamori
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP57048353A priority Critical patent/JPS58165143A/ja
Publication of JPS58165143A publication Critical patent/JPS58165143A/ja
Publication of JPS635792B2 publication Critical patent/JPS635792B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Digital Computer Display Output (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 (a) 発明の技術分野 本発明は計算機やワードプロセツサ等におい
て、文章中の漢字や意味を有する最小の熟語の発
声情報、即ち読み方及びアクセント等を添えて表
現し、更に/又は文章中の漢字や意味を有する最
小の熟語の画面表示方法を表現するための漢字記
憶方式に関する。
(b) 技術の背景 情報処理産業の急速な発展に伴い、特に日本に
於ては最近日本語情報処理方式が急速に発展しつ
つある。日本語の取扱いでは漢字まじりの文章が
特徴で且つ該漢字には複数の読み方があり、その
読み方が不適切であると意味が通じない。又音声
合成等に於ては読み方のみならず、アクセントも
適切でないと滑らかな表現が得られず聞き取りに
くくなる。又デイスプレイ装置等に文章を表示す
る場合、漢字や熟語の表示方法を特に変えて表示
したい等の要望がある。従つて文章中の漢字や熟
語に読み方の発音情報やアクセント情報等の発声
情報や画面出力情報を合わせて計算機やワードプ
ロセツサ等に記憶させ必要に応じて表現し得る様
にしたいと言う希望があり、その対策が望まれて
いる。
(c) 従来技術と問題点 漢字や仮名を2値符号のコードで表現し、記憶
装置に記憶する方法は知られており、文章中の漢
字の読み方も該漢字にルビを付す要領で漢字コー
ドに読けて該ルビをコード化し同時に文章格納メ
モリ等に記憶させる方法がある。しかしこの方法
を用いるとルビの語数が不定長のため該コードの
範囲を示す記号が必要となり括弧等を用いて区分
することとなるため、一漢字を表現するビツトの
総数は非常に大きなものとなり、之にアクセント
情報や画面出力情報を加えると文章を記憶する文
章格納メモリの容量は膨大なものとなる。例えば
「計算機」を例として現在用いられている16進2
バイトによるコードで表現すると第1図の如くに
なる。即ち「計算機」を表現する漢字コードだけ
ならば6バイトあれば良いものが発音記号を付す
だけで24バイトも必要であり、これにアクセント
情報等加えると更に多くのビツトを必要とし計算
機やワードプロセツサ等の文章格納メモリの容量
を増加させ不経済となる欠点がある。
(d) 発明の目的 本発明の目的は上記欠点を除くため一漢字及び
意味を有する最小の熟語に対する2値符号コード
と共に発音情報、アクセント情報、画面出力情報
等を表わす漢字補助番号を合わせて表現すること
により、計算機やワードプロセツサ等の装置に於
て、文章中での漢字や熟語に対する音声出力のた
めの情報や画面表示に関する情報を即時に与えた
り、読み取ることを可能とすると共に、該音声出
力のための情報や画面表示に関する情報を少ない
ビツト数で表現し、文章記憶用のメモリの容量を
小さくし装置の経済化を計り得る漢字記憶方式を
提供することにある。
(e) 発明の構成 漢字を2値符号のコードとして文章格納メモリ
に記憶する装置において、予め一漢字及び意味を
有する最小の熟語に対し、発音情報とアクセント
情報及び画面出力情報を区別して表すために、所
定数、例えば2バイトに限定した複数の漢字補助
番号を、該一漢字及び意味を有する最小の熟語に
付与して記憶させた辞書フアイルと、該辞書フア
イルから発音情報とアクセント情報及び画面出力
情報に基づき文章中の漢字及び意味を有する最小
の熟語に対応した漢字補助番号を読出す辞書検索
部とを設け、一漢字及び意味を有する最小の熟語
を表す2値符号のコードに、該辞書検索部が読出
した漢字補助番号を付加して、前記文章格納メモ
リに書込むものである。
(f) 発明の実施例 本発明の漢字記憶方式について実施例に従い説
明する。
第2図は本発明の漢字に対応する総ての発音、
アクセント、画面表示に対し漢字補助番号を与え
て構成する辞書フアイルの例を示す。「計」の漢
字を表わす16進2バイトによるコードはB7D7で
ある。発音は「ケイ」と「ハカ(ル)」の2種が
あり夫々0001と0002の番号が与えられる。「ケイ」
の発音で大文字表示をしたい場合0101の番号が与
えられる。「算」については漢字を表わすコード
はBBBBであり、発音は「サン」と「カゾ(エ
ル)」の2種があり夫々に0001と0002の番号が
「サン」でアクセントが下る場合は01A1の番号が
大文字表示は0101の番号が与えられる。「機」に
ついても前記同様に番号が夫々与えられることを
示す。
第3図は第2図辞書フアイルを用いて索引した
漢字補助番号により「計算機」を大文字表示する
場合の表現を示す。即ち漢字コード6バイトに漢
字補助番号6バイトを加えて12バイトで表現し得
る。前記第1図の24バイト+αに比し、大幅に少
いバイト数で漢字及び発声情報、画面出力情報等
の情報も同時に表現し得る。
第4図は本発明の2字の漢字で構成される意味
を有する最小の熟語に対応する総ての発音、アク
セント、画面表示に対し漢字補助番号を与えて構
成する辞書フアイルの例を示す。「計算」の熟語
を表わす16進2バイトによるコードは
B7D7BBBBで発音は「ケイサン」である、アク
セントはサンの発音に2種類あり夫々発音を含め
0001と0011が与えられ画面表示で大文字表示をし
たい場合夫々0101と0111が与えられる。
第5図は第4図の辞書フアイルを用いて索引し
た漢字補助番号で「計算機」を大文字表示する場
合の表現を示す。即ち漢字コード6バイトに漢字
補助番号4バイトで合計10バイトで表現し得る。
前記第1図の24バイト+αに比し大幅に少いバイ
ト数で漢字及び発声情報、画面表示情報等の情報
が表現出来、更に第5図の12バイトに比しても少
い事がわかる。
第6図は本発明の3字の漢字で構成される意味
を有する最小の熟語に対応する総ての発音、アク
セント、画面表示に対し漢字補助番号を与えて構
成する辞書フアイルの例を示す。「計算機」の熟
語を表わ16進2バイトによるコードは
B7D7BBBB B5A1 で発音は「ケイサンキ」で
ある。アクセントは1種類になり画面表示で大文
字表示をしたい場合の2種類で0001と0101の漢字
補助番号が与えられる。
第7図は第6図の辞書フアイルを用いて索引し
た漢字補助番号で「計算機」を大文字表示する場
合の表現を示す。即ち漢字コード6バイトに漢字
補助番号2バイトの合計8バイトで表現し得る。
第1図、第3図、第5図に比し最小のバイト数で
表現し得る。
以上説明した如く辞書フアイルを漢字及び意味
を有する最小の熟語の発声情報、画面出力情報等
の情報を漢字補助番号で表現し得る様に構成すれ
ば少いビツト数で文章を構成することが可能であ
り、特に熟語は漢字数が多い程有利なことがわか
る。又画面表示は大文字表示を例として上げた
が、アンダーライン付とか色表示等の情報を与え
て構成出来ることは勿論である。
第8図は本考案を用いる計算機又はワードプロ
セツサ等の内部処理の一例を説明する図である。
音声認識部6で認識され処理された文章は順次辞
書検索部3へ送られ、文章中の漢字及び意味を有
する最小の熟語は発音情報とアクセント情報によ
り辞書フアイル2より漢字補助番号が索引され
る。該索引された漢字補助番号は該当漢字又は意
味を有する最小の熟語のコードに添えられて文章
格納メモリ1へ順次記憶される。必要に応じキー
ボード4より入力すれば文章格納メモリ1に記憶
されている文章が表示部7に表示される。この時
表示部7は漢字補助番号の先頭の数字が0である
ことで、文字を表す2値符号コードと区別し、漢
字補助番号が指示する画面出力情報に対応して文
字のみ表示する。ここでキーボード4より画面表
示方法を変えたい漢字又は熟語に対し入力するこ
とで辞書検索部3は辞書フアイル2より画面出力
情報を含む漢字補助番号を索引し、文章格納メモ
リ1に再度記憶させる。尚この画面出力情報は音
声合成部5に入力する際同時に処理しても良いこ
とは勿論である。
文章格納メモリ1より音声合成部5へ送出され
る文章は辞書検索部3に於て、辞書フアイル2よ
り該文書を構成する漢字と熟語の発音情報とアク
セント情報を該漢字や熟語のコードに添えられた
漢字補助番号により同時に与えられるため、音声
合成部5は、漢字補助番号の先頭の数字が0であ
ることで、文字を表す2値符号コードと区別し、
漢字補助番号が指示する発音とアクセントに基づ
き、なめらかな発声により前記文章を放送するこ
とが出来る。
(g) 発明の効果 以上説明した如く本発明は文章中の漢字を少な
いビツト数で発音情報、アクセント情報、画面情
報等を含めて表現し、文章格納メモリに記憶させ
るため、該文章格納メモリの容量を小さくするこ
とが可能で、同一容量ならば多くの文章を記憶さ
せることが出来るため、その効果は大である。
【図面の簡単な説明】
第1図は漢字に読み方を付して16進2バイトで
表現した例を示す図、第2図は本発明の漢字に対
応する総ての発音、アクセント、画面表示に対し
漢字補助番号を与えて構成する辞書フアイルの例
を示す図、第3図は第2図の辞書フアイルを用い
て漢字に漢字補助番号を付して表現した例を示す
図、第4図は本発明の2字の漢字で構成される熟
語に対し漢字補助番号を与えて構成する辞書フア
イルの例を示す図、第5図は第4図の辞書フアイ
ルを用いて熟語に漢字補助番号を付して表現した
例を示す図、第6図は本発明の3字の漢字で構成
される熟語に対し漢字補助番号を与えて構成する
辞書フアイルの例を示す図、第7図は第6図の辞
書フアイルを用いて熟語に漢字補助番号を付して
表現した例を示す図、第8図は本発明を用いる計
算機又はワードプロセツサ等の内部処理の一例を
説明する図である。 1は文章格納メモリ、2は辞書フアイル、3は
辞書検索部、4はキーボード、5は音声合成部、
6は音声認識部、7は表示部である。

Claims (1)

  1. 【特許請求の範囲】 1 漢字を2値符号のコードとして文章格納メモ
    リ1に記憶する装置において、 予め一漢字及び意味を有する最小の熟語に対
    し、発音情報とアクセント情報及び画面出力情報
    を区別して表すために、所定数に限定した複数の
    漢字補助番号を、該一漢字及び意味を有する最小
    の熟語に付与して記憶させた辞書フアイル2と、 該辞書フアイル2から発音情報とアクセント情
    報及び画面出力情報に基づき文章中の漢字及び意
    味を有する最小の熟語に対応した漢字補助番号を
    読出す辞書検索部3とを設け、 一漢字及び意味を有する最小の熟語を表す2値
    符号のコードに、該辞書検索部3が読出した漢字
    補助番号を付加して、前記文章格納メモリ1に書
    込むことを特徴とする漢字記憶方式。 2 上記所定数は2バイトであることを特徴とす
    る特許請求の範囲第1項記載の漢字記憶方式。 3 上記漢字補助番号は発音情報及びアクセント
    情報等より構成される発声情報及び/又は画面出
    力情報を数字で表現したものであることを特徴と
    する特許請求の範囲第1項記載の漢字記憶方式。
JP57048353A 1982-03-26 1982-03-26 漢字記憶方式 Granted JPS58165143A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57048353A JPS58165143A (ja) 1982-03-26 1982-03-26 漢字記憶方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57048353A JPS58165143A (ja) 1982-03-26 1982-03-26 漢字記憶方式

Publications (2)

Publication Number Publication Date
JPS58165143A JPS58165143A (ja) 1983-09-30
JPS635792B2 true JPS635792B2 (ja) 1988-02-05

Family

ID=12801000

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57048353A Granted JPS58165143A (ja) 1982-03-26 1982-03-26 漢字記憶方式

Country Status (1)

Country Link
JP (1) JPS58165143A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63152393U (ja) * 1987-03-26 1988-10-06

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60186958A (ja) * 1984-03-05 1985-09-24 Toshiba Corp 日本語処理方式
JP2580566B2 (ja) * 1986-03-18 1997-02-12 富士通株式会社 音声合成装置
JP2580565B2 (ja) * 1986-03-18 1997-02-12 富士通株式会社 音声情報辞書作成装置
JPS62217299A (ja) * 1986-03-18 1987-09-24 富士通株式会社 音声合成システム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS53114619A (en) * 1977-03-17 1978-10-06 Fujitsu Ltd Voice data and visual data output system
JPS5676838A (en) * 1979-11-28 1981-06-24 Hitachi Ltd Aural output display unit
JPS5769470A (en) * 1980-10-15 1982-04-28 Toshiba Corp Japanese word processor

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63152393U (ja) * 1987-03-26 1988-10-06

Also Published As

Publication number Publication date
JPS58165143A (ja) 1983-09-30

Similar Documents

Publication Publication Date Title
US5164900A (en) Method and device for phonetically encoding Chinese textual data for data processing entry
US5047932A (en) Method for coding the input of Chinese characters from a keyboard according to the first phonetic symbols and tones thereof
US4636977A (en) Language translator with keys for marking and recalling selected stored words
Samudravijaya Indian language speech label (ILSL): A de facto national standard
US4455615A (en) Intonation-varying audio output device in electronic translator
JPS635792B2 (ja)
Alimova BORROWINGS-LINGUISTIC PHENOMENA.
JPS635793B2 (ja)
JP2580565B2 (ja) 音声情報辞書作成装置
Akmuradov et al. Organization of initial text processing in the Uzbek language synthesizer
JPS59197923A (ja) 文書作成装置
JPH0155507B2 (ja)
JP3002202B2 (ja) 規則音声合成装置における数詞読み付与装置
JPS6037510B2 (ja) ロ−マ字漢字変換方式
CN1048341C (zh) 模糊汉字变换装置
KR20150076587A (ko) 다언어로 찾는 중국어 사전
JP2573565B2 (ja) 単語綴りの発音記号への変換装置
JPS61125677A (ja) 音声ワ−ドプロセツサ
JPS6136796A (ja) 発音辞書編集装置
JPS63189933A (ja) 文章読み上げ装置
JPS59180597A (ja) 音声分割方式
Kobbervig The Qurʾān in Sixteenth-Century Spain: Six Morisco Versions of Sūra 79. Colección Támesis, Serie A: Monografías, 82
Garvin Rã-txa Hu-ni-ku-ĩ
JPH04127199A (ja) 外国語単語の日本語発音決定方法
JP2004355496A (ja) 音素索引多要素行列構造の英語と他言語の対訳辞書