JPH11175511A - 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体 - Google Patents

中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体

Info

Publication number
JPH11175511A
JPH11175511A JP9346375A JP34637597A JPH11175511A JP H11175511 A JPH11175511 A JP H11175511A JP 9346375 A JP9346375 A JP 9346375A JP 34637597 A JP34637597 A JP 34637597A JP H11175511 A JPH11175511 A JP H11175511A
Authority
JP
Japan
Prior art keywords
input
pinyin
tone
character string
kanji
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9346375A
Other languages
English (en)
Inventor
Yasushi Ishizuka
靖 石塚
Shigemi Nakazato
茂美 中里
Kaitou Rai
海涛 雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP9346375A priority Critical patent/JPH11175511A/ja
Publication of JPH11175511A publication Critical patent/JPH11175511A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】ユーザの入力操作をできるだけ妨げずに、より
簡単かつ正確に声調付きピンイン入力を可能として、変
換率の向上を図る。 【解決手段】声調入力規則テーブル25にはピンイン文
字列の各文字の字体によって声調の種類を判別するため
の声調入力規則が定義されている。入力部21を通じて
ピンイン文字列の入力および変換指示があると、制御部
22は変換部23を通じて変換処理を実行する。この場
合、変換部23では、声調入力規則テーブル25を参照
して上記ピンイン文字列の各文字の字体から声調の種類
を判別し、その声調の種類とピンイン文字列とに基づい
て中国語変換辞書24を検索し、当該ピンイン文字列を
漢字に変換する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、中国語文書の作成
に用いられる中国語ワードプロセッサ等の中国語入力変
換処理装置に係り、特にピンイン入力を行なう場合に用
いて好適な中国語入力変換処理装置、中国語入力変換処
理方法、中国語入力変換処理プログラムを記録した記録
媒体に関する。
【0002】
【従来の技術】従来、中国語ワードプロセッサ等の中国
語入力変換処理装置では、中国語の漢字とその読みを表
す表音記号(以下、ピンインと称す)とを対応付けた辞
書を用い、中国語の読みをピンインで入力し、これを漢
字に変換して出力する機能を備えている。これをピンイ
ン漢字変換機能(日本語ワードプロセッサのかな漢字変
換機能に相当)と呼ぶ。
【0003】ここで、中国語では、1つの漢字の発音は
必ず1音節になっている。1つの音節はさらに「声母」
と呼ばれる先頭子音(音節の先頭にくる子音)と、「韻
母」と呼ばれる「声母」を除いた部分(母音、二重母
音、鼻音化母音などがある)とで構成されている。
【0004】ピンイン入力方式では、このような声母と
韻母をアルファベットで入力することになる。ところ
が、中国語では、同じピンインを持つ漢字が複数存在す
ることがあり、ピンインだけを入力して変換を行なって
も、ユーザが意図する漢字を第1の変換候補として必ず
しも得られないことがある。
【0005】そこで、このような問題を解決するため
に、ピンイン表記と合わせて、音節の抑揚を表わす「四
声」と呼ばれる声調記号を入力することにより、ユーザ
が意図する変換候補を提示する方法が一般的に採られて
いる。
【0006】図10および図11に従来の声調付きピン
イン入力方法を示す。図10は数字を声調情報として入
力する場合の例である。図10(a)に示すように、中
国語の漢字の読みを入力する場合に、声母と韻母からな
る音節の後に声調記号を付加する。
【0007】声調には、基本的なものが4つあり、これ
を四声(しせい)と呼ぶ。そのうち、音を同じ高さで伸
ばすものを第1声、上げるものを第2声、曲げるものを
第3声、下げるものを第4声という。同じ音節でも声調
が異なれば、漢字も意味も異なってくる。例えば音節
[qi]は、以下のようになる。
【0008】第1声…[期] 第2声…[奇] 第3声…[起] 第4声…[器] そこで、同図(b)に示すように、第1声〜第4声まで
の声調を1〜4の数字で表し、音節の後に付ける。例え
ば[期]、[奇]、[起]、[器]の読みは、それぞれ
[qi1]、[qi2]、[qi3]、[qi4]と表
わすことができる。
【0009】また、別の方法として、声調の入力規則を
定める方法がある。図11は従来の声調入力規則を用い
てピンインを入力する場合の例である。図11(a)に
示すように、声調の入力規則を定義しておく。
【0010】第1声…無符号 第2声…語尾に“J”をつける 第3声…第一母音を重ねる 第4声…語尾に“h”をつける このような入力規則を用いた場合には、同図(b)に示
すように、例えば[期]、[奇]、[起]、[器]の読
みは、それぞれ[qi]、[qij]、[qii]、
[qih]と表わすことができる。
【0011】
【発明が解決しようとする課題】上記したように、従
来、発音表記(ピンイン)から中国語の漢字に変換する
場合の変換率を向上させるために、ピンインの他に四声
を示す声調情報も合わせて入力する方法が採られてい
た。
【0012】しかしながら、上記のような方法で声調情
報を入力すると、例えば図10の方法では、図12に示
すように、入力文字として入力した数字と声調情報とし
て入力した数字との区別が付かず、ユーザが意図した変
換結果を正確に得ることができないといった問題があ
る。同様に、図11に示すような方法で声調情報を入力
した場合にも、声調情報と他の入力文字との区別が付か
ず、ユーザが意図した変換結果を正確に得ることができ
ないといった問題がある。
【0013】また、図10または図11のいずれの入力
方法でも、声調情報を入力するために、声母および韻母
からなるピンイン文字列の他に、声調情報としての数字
あるいは文字を余分に入力しなければならないため、ユ
ーザの入力操作が繁雑となる問題がある。
【0014】本発明は上記のような点に鑑みなされたも
ので、ユーザの入力操作をできるだけ妨げずに、より簡
単かつ正確に声調付きピンイン入力を可能として、変換
率の向上を図るようにした中国語入力変換処理装置、中
国語入力変換処理方法、中国語入力変換処理プログラム
を記録した記録媒体を提供することを目的とする。
【0015】
【課題を解決するための手段】(1)本発明の中国語入
力変換処理装置は、中国語の漢字の読みを示すピンイン
を入力し、その入力されたピンインを漢字に変換する中
国語入力変換処理装置であって、ピンイン文字列を入力
する入力手段と、各単語毎にピンインおよび声調情報と
それに対応する漢字とを記憶した変換辞書と、ピンイン
文字列の各文字の字体によって声調の種類を定義した声
調入力規則を記憶した入力規則記憶手段と、この入力規
則記憶手段に記憶された声調入力規則を参照して、上記
入力手段によって入力されたピンイン文字列をチェック
し、そのピンイン文字列の各文字の字体から声調の種類
を判別する声調判別手段と、この声調判別手段によって
判別された声調の種類と上記入力されたピンイン文字列
とに基づいて上記変換辞書を検索し、当該ピンイン文字
列を漢字に変換する変換手段と、この変換手段によって
得られた漢字を変換結果として出力する出力手段とを具
備したことを特徴とする。
【0016】このような構成によれば、中国語漢字の読
みであるピンイン文字列のみを入力することにより、ピ
ンイン文字列の各字体(例えば声母の先頭文字と韻母の
先頭文字の各字体)から声調の種類が判別され、その四
声の種類とピンインの2つの入力情報に基づいてピンイ
ン漢字変換処理が行なわれる。
【0017】したがって、音節の後に数字あるいは文字
が付加されているような場合でも、四声情報と入力文字
との区別して正しい変換結果を得ることができる。ま
た、四声情報としての数字あるいは文字の入力を不要と
して、ユーザの入力操作を軽減することができる。
【0018】(2)本発明の中国語入力変換処理装置
は、中国語の漢字の読みを示すピンインを入力し、その
入力されたピンインを漢字に変換する中国語入力変換処
理装置であって、ピンイン文字列が記述されたファイル
を読み込むファイル読込み手段と、各単語毎にピンイン
および声調情報とそれに対応する漢字とを記憶した変換
辞書と、ピンイン文字列の各文字の字体によって声調の
種類を定義した声調入力規則を記憶した入力規則記憶手
段と、この入力規則記憶手段に記憶された声調入力規則
を参照して、上記ファイル読込み手段によって読み込ま
れたファイルに記述されたピンイン文字列をチェック
し、そのピンイン文字列の各文字の字体から声調の種類
を判別する声調判別手段と、この声調判別手段によって
判別された声調の種類と上記ファイルに記述されたピン
イン文字列とに基づいて上記変換辞書を検索し、当該ピ
ンイン文字列を漢字に変換する変換手段と、この変換手
段によって得られた漢字を変換結果として出力する出力
手段とを具備したことを特徴とする。
【0019】このような構成によれば、中国語漢字の読
みであるピンイン文字列のみが記述されたファイルを読
み込むことにより、ファイルに記述されたピンイン文字
列の各文字の字体(例えば声母の先頭文字と韻母の先頭
文字の各字体)から声調の種類が判別され、その四声の
種類とピンインの2つの入力情報に基づいてピンイン漢
字変換処理が行なわれる。
【0020】したがって、ピンイン文字列が記述された
ファイルを用いてピンイン入力を行う場合でも、四声情
報と入力文字との区別して正しい変換結果を得ることが
できる。また、ファイルの作成に際し、四声情報として
の数字あるいは文字の入力を不要として、ユーザの入力
操作を軽減することができる。
【0021】
【発明の実施の形態】以下、図面を参照して本発明の一
実施形態を説明する。図1は本発明の一実施形態に係る
中国語入力変換処理装置のシステム構成を示すブロック
図である。なお、本実施形態における中国語入力変換処
理装置は、例えば磁気ディスク等の記録媒体に記録され
たプログラムを読み込み、このプログラムによって動作
が制御されるコンピュータによって実現される。
【0022】図1に示すように、本実施形態における中
国語入力変換処理装置は、CPU11、メモリ12、入
力装置13、表示装置14、外部記憶装置15、印刷装
置16、通信装置17によって構成される。
【0023】CPU11は、本装置の動作全体を制御す
るものであり、メモリ12に格納されたプログラムの起
動で動作する。なお、メモリ12に格納されたプログラ
ムに基づいて実現される機能としては、アプリケーショ
ンプログラムによるワードプロセッサ等がある。
【0024】メモリ12は、例えばROMやRAMから
なり、本装置で使用される各種プログラムやフォント
(中国語フォントを含む)等のデータを格納する。この
メモリ12には、ワードプロセッサを実現するアプリケ
ーションプログラムなどのプログラムデータを格納する
ためのプログラム領域12aの他、入力バッファ12
b、候補バッファ12c、文書バッファ12dなどが設
けられている。
【0025】入力バッファ12bは、文書作成のために
ピンイン入力された読み文字列を格納する。候補バッフ
ァ12cは、ピンイン漢字変換によって変換結果として
得られた各変換候補を格納する。文書バッファ12d
は、中国語漢字からなる文書データを格納する。
【0026】入力装置13は、キーボードからなり、本
装置に対する指示やデータの入力を行なうものであり、
ピンインよる読み文字列の入力や、その入力された読み
文字列に対する変換指示(「変換」キーの操作による指
示)などを行なうためのものである。
【0027】表示装置14は、例えばCRT (Cathode
Ray Tube) やLCD (Liquid Crystal Display) からな
り、入力装置13を通じて入力された読み文字列やその
読み文字列に対する変換結果の表示などを行なう。
【0028】外部記憶装置15は、例えばHDD (Hard
Disk Drive) やCD−ROM (Compact Disc Read On
ly Memory) からなり、各種プログラムや文書などのデ
ータを保存する。この外部記憶装置15には、ワードプ
ロセッサを実現するためのアプリケーションプログラム
の他、ピンイン漢字変換処理で使用する中国語変換辞書
24(図3参照)、声調入力規則を定めた声調入力規則
テーブル25(図4参照)などのデータも含まれる。
【0029】印刷装置16は、文書の印刷等を行なうた
めに用いられる。この印刷装置16としては、本装置に
内蔵されたものでも、外付けにて接続されるものでも良
い。また、通信装置17は、例えば構内LAN (Local
Area Network) や通信ネットワーク等を介して外部装置
とのデータの送受信制御を行なう。
【0030】次に、図1に示すシステム構成によって実
現される中国語入力変換処理装置の機能構成について説
明する。図2は図1のシステム構成によって実現される
中国語入力変換処理装置の機能構成を示すブロック図で
ある。図2に示すように、本実施形態における中国語入
力変換処理装置は、入力部21、制御部22、変換部2
3、中国語変換辞書24、声調入力規則テーブル25、
出力部26を有する。
【0031】入力部21は、入力装置13から入力され
る変換対象となる読み文字列(ピンイン文字列)や変換
指示等の入力処理を行なう。制御部22は、システム全
体の制御を行なうものであり、キー入力に応じて各部を
制御する。声調入力規則の変更画面30(図6参照)の
表示、変更処理はここで行なう。
【0032】変換部23は、中国語変換辞書24を参照
してピンイン漢字変換処理を行ない、入力されたピンイ
ン文字列を中国語の漢字に変換し、その変換結果として
得られた変換候補を制御部22に返す。中国語変換辞書
24は、各単語毎にピンイン(読み)および声調情報と
それに対応する漢字(見出し)など、ピンイン漢字変換
処理に必要な情報を記憶している(図3参照)。
【0033】声調入力規則テーブル25は、入力された
ピンイン文字列の各文字の字体によって声調の種類を定
義したものである。本実施形態では、ピンイン文字列の
声母の先頭文字と韻母の先頭文字の字体(アルファベッ
トの大文字/小文字)の組み合わせによって声調の種類
を定義している(図4参照)。
【0034】出力部26は、ユーザが入力したピン文字
列やピンイン漢字変換処理によって得られた変換結果な
どを表示装置14に表示したり、アプリケーションへの
出力データを作成する。
【0035】図3は中国語変換辞書24の構成を示す図
である。この中国語変換辞書24には、各単語毎にピン
イン(読み)および声調情報とそれに対応する漢字(見
出し)が格納されている。図3の例では、読み[qi]
に対する見出しとして、[期],[奇],[起],
[器]といった各漢字がそれぞれの声調情報(第1声〜
第4声)と共に格納されている。
【0036】図4は声調入力規則テーブル25の構成を
示す図である。この声調入力規則テーブル25は、ピン
イン文字列の声母の先頭文字と韻母の先頭文字の字体
(アルファベットの大文字/小文字)の組み合わせによ
って声調の種類を定義している。図4の例では、以下の
ように定義されている。
【0037】声母の先頭文字が大文字、韻母の先頭文字
の小文字のときに第1声 声母の先頭文字が小文字、韻母の先頭文字の大文字のと
きに第2声 声母の先頭文字が大文字、韻母の先頭文字の大文字のと
きに第3声 声母の先頭文字が小文字、韻母の先頭文字の小文字のと
きに第4声 ここで、本発明の声調情報の入力方法について説明す
る。
【0038】中国語では、1つの漢字の発音は必ず1音
節になっている。1つの音節は「声母」と「韻母」とで
構成されている。さらに、音節の抑揚を表わす「四声」
と呼ばれる声調(日本語のアクセントに似たようなも
の)がある。漢字の中国音は1字1音節であり、声調は
個々の漢字に付いている。現代中国音の声調には、基本
的なものが4つあり、これを四声(しせい)と呼ぶ。そ
のうち、音を同じ高さで伸ばすものを第1声、上げるも
のを第2声、曲げるものを第3声、下げるものを第4声
という。
【0039】同じ音節でも声調が異なれば、漢字も意味
も異なってくる。例えば音節[qi]は、以下のように
なる。 第1声…[期] 第2声…[奇] 第3声…[起] 第4声…[器] 一般的には、第1声〜第4声までの声調を1〜4の数字
で表し、音節の後に付けたり、所定の入力規則に従った
文字を音節の後に付けるなどの方法を採っているが、こ
のような方法では、声調情報として入力した数字あるい
は文字と入力文字として入力した数字あるいは文字との
区別が付かなかったり、余分なキー操作が必要となるな
どの不具合がある。
【0040】そこで、本実施形態では、特定の声調記号
を用いずに音節のみをピンイン入力し、声調情報は図4
に示す声調入力規則テーブル25に格納された声調入力
規則に従って入力するものとする。
【0041】すなわち、図5(a)に示すように、1つ
の漢字のピンイン表記は声母と韻母に分けることがで
き、その声母と韻母の先頭のアルファベットが大文字か
小文字かで第1声〜第4声までの声調を区別する。
【0042】同図(b)に具体例を示す。同じピンイン
表記[qi]で[期],[奇],[起],[器]の4つ
の漢字が存在する。ユーザは声調を意識して声母および
韻母からなるピンイン文字列の各文字を入力すること
で、意図する漢字を得ることができる。
【0043】例えば第1声の声調を有する[期]を得た
い場合には、図4に示す声調入力規則テーブル25に記
憶された声調入力規則に従って、声母の先頭アルファベ
ット[q]を大文字、韻母の先頭アルファベット[i]
を小文字にして、[Qi]といったピンイン文字列を入
力すれば良い。
【0044】同様に、第2声の声調を有する[奇]を得
たい場合には、声母の先頭アルファベット[q]を小文
字、韻母の先頭アルファベット[i]を大文字にして、
[qI]といったピンイン文字列を入力する。
【0045】第3声の声調を有する[起]を得たい場合
には、声母の先頭アルファベット[q]を大文字、韻母
の先頭アルファベット[i]を小文字にして、[QI]
といったピンイン文字列を入力する。
【0046】第4声の声調を有する[器]を得たい場合
には、声母の先頭アルファベット[q]を小文字、韻母
の先頭アルファベット[i]を小文字にして、[qi]
といったピンイン文字列を入力する。
【0047】なお、実際には、上記第1声〜第4声の他
に、軽声の声調(軽く短く発音するもの)がある。この
軽声を使う漢字はごく僅かに限られているため、本実施
形態では、軽声については、例えば数字の[0]を付加
するなど、一般的な方法を用いるものとする。
【0048】また、図5では、声母、韻母共に1文字で
構成された漢字を例にしているため、それらの1文字が
そのまま声調対象の文字として用いられることになる
が、例えば「調」といった漢字の場合には、ピンイン表
記は「tiao」であり、そのうち、声母は「t」、韻
母「iao」である。したがって、このようなピンイン
表記を有する「調」の場合には、声母「t」の先頭文字
「t」と韻母「iao」の先頭文字「i」が声調対象の
文字となる。
【0049】また、例えば「中央」といったように、複
数の単語からなる漢字の場合には、各単語(音節)毎に
上記声調を意識したピンイン入力を行なうことになる。
この場合、「中央」のピンイン表記は「zhog/ya
ng」(“/”は各単語のピンイン入力の切れ目を示す
ものであり、実際には入力しない)である。したがっ
て、「zhong」については声母「zh」の先頭文字
「z」と韻母「ong」の先頭文字「o」が声調対象の
文字となり、「yang」については声母「y」の先頭
文字「y」と韻母「ang」の先頭文字「a」が声調対
象の文字となり、それらの単語毎に上記声調を意識した
ピンイン入力を行なうことになる。
【0050】また、このような声調入力規則は、図6に
示すような変更画面30にて、ユーザが任意に変更する
ことができる。この変更画面30には、第1声〜第4声
毎に声母と韻母の各字体(大文字/小文字)の規則を設
定するための設定部31a,31b〜34a,34b
と、確定指示を行なうための「OK」ボタン35および
取消し指示を行なうための「キャンセル」ボタン36が
設けられている。
【0051】設定部31a,31bは第1声用設定部、
設定部32a,32bは第2声用設定部、設定部33
a,33bは第3声用設定部、設定部34a,34bは
第4声用設定部である。ユーザはこれらの設定部31
a,31b〜34a,34bを通じて第1声〜第4声毎
に声母と韻母の字体(大文字/小文字)の規則を設定
し、「OK」ボタン35を押下する。これにより、その
設定内容に従って、図4に示す声調入力規則テーブル2
5の内容が変更される。以後、この変更後の声調入力規
則に従って、入力ピンインから声調の種類が判別される
ことになる。
【0052】次に、本装置の動作を説明する。ここで
は、(a)ユーザ入力によるピンインの変換処理、
(b)ファイルを用いたピンインの変換処理、(c)四
声入力規則の変更処理に分けて、それぞれの動作を説明
する。
【0053】(a)ユーザ入力によるピンインの変換処
理 図7はユーザ入力によるピンインの変換処理の動作を示
すフローチャートである。まず、ユーザは入力装置13
を通じて中国語の読みであるピンイン文字列を入力する
(ステップA11)。
【0054】この場合、ピンイン文字列中の各単語毎に
声母および韻母からなる音節をアルファベットで入力
し、声調については、その声母の先頭文字および韻母の
先頭文字の各字体を図4に示す声調入力規則テーブル2
5に記憶された声調入力規則に従って大文字または小文
字で入力する。
【0055】なお、声母、韻母共に先頭文字以外は小文
字で入力するものとする。また、複数の漢字からなる各
単語の読みを連続して入力できるものとする。このとき
入力されたピンイン文字列は、メモリ12に設けられた
入力バッファ12bに格納される。
【0056】ここで、「変換」キーの押下により、変換
指示を行なうと(ステップA12のYes)、その変換
指示が入力部21を通じて制御部22に与えられる。こ
れにより、制御部22は入力バッファ12bに格納され
たピンイン文字列を変換部23に送り、以下のようなピ
ンイン漢字変換処理を実行する。
【0057】変換部23は、まず、入力されたピンイン
文字列を各単語の読み毎に声母と韻母の組合せで区切る
(ステップA13)。そして、変換部23は、各単語の
1つ1つに対し、声母の先頭文字および韻母の先頭文字
の字体をそれぞれチェックし、声調入力規則テーブル2
5を参照して、それらの字体の組み合わせから声調の種
類を判別する(ステップA14〜A23)。
【0058】今、図4に示すような声調入力規則が声調
入力規則テーブル25に格納されているものとすると、
声母の先頭文字が大文字、韻母の先頭文字が大文字の場
合に(ステップA15のYes,ステップA17のYe
s)、変換部23は当該単語(1つの漢字)の声調を第
3声と判断する(ステップA18)。
【0059】また、声母の先頭文字が大文字、韻母の先
頭文字が小文字の場合には(ステップA15のYes,
ステップA17のNo)、変換部23は第1声と判断す
る(ステップA19)。声母の先頭文字が小文字、韻母
の先頭文字が大文字の場合には(ステップA15のN
o,ステップA21のYes)、変換部23は第2声と
判断する(ステップA22)。声母の先頭文字が小文
字、韻母の先頭文字が小文字の場合には(ステップA1
5のNo,ステップA21のNo)、変換部23は第4
声と判断する(ステップA23)。
【0060】このようにして、入力されたピンイン文字
列を各単語毎に声母の先頭文字と韻母の先頭文字の各字
体の組み合わせから声調の種類を判別する。全ての単語
について、声調の種類を判別すると(ステップA24の
Yes)、変換部23は中国語変換辞書24を参照し
て、各単語毎に上記判別された声調の種類とピンイン文
字列とに基づいて当該ピンイン文字列を中国語の漢字に
変換し、その変換結果を制御部22に返す(ステップA
25)。このとき変換結果として得られた各単語の変換
候補は、候補バッファ12cに格納される。
【0061】制御部22は、この候補バッファ12cに
格納された各単語の変換候補を出力部26を通じて表示
装置14に表示する(ステップA26)。この場合、声
調情報によって特定された漢字が変換候補として優先的
に表示されることになる。
【0062】このように、ピンイン文字列の中の声母の
先頭文字と韻母の先頭文字の各字体の組み合わせから四
声の種類が判別され、その四声の種類とピンインの2つ
の入力情報に基づいてピンイン漢字変換処理が行なわれ
ることになる。
【0063】したがって、音節の後に数字あるいは文字
が付加されているような場合でも、四声情報と入力文字
との区別して正しい変換結果を得ることができる。ま
た、従来のように四声情報としての数字あるいは文字の
入力を必要としないため、ユーザの入力操作を軽減する
ことができる。
【0064】(b)ファイルを用いたピンインの変換処
理 ところで、上記(a)の説明では、ユーザが入力装置1
3を通じて入力したピンイン文字列を変換する場合を想
定したが、このピンイン文字列の入力を特定のファイル
の読み込みによって行なうこともできる。このファイル
には、ピンイン文字列が記述されている。
【0065】例えば中国語入力機能を備えていない装置
では、ピンイン文字列から中国語の漢字へ変換すること
はできない。そこで、ピンイン文字列のみを記述したフ
ァイルを作成しておき、このファイルを中国語入力機能
を備えた装置にかけて、中国語の漢字へ変換するという
ものである。
【0066】図8はファイルを用いたピンインの変換処
理の動作を示すフローチャートである。まず、上述した
ファイルが格納された記録媒体を記憶外部記憶装置15
にセットし、そのファイルに記述されたピンイン文字列
を所定読込み単位(例えば1行分)で読み込む(ステッ
プB11)。
【0067】この場合、ファイル内には、ピンイン文字
列中の各単語毎に声母および韻母からなる音節がアルフ
ァベットで記述されており、声調については、その声母
の先頭文字および韻母の先頭文字の字体が図4に示す声
調入力規則に従って大文字または小文字で記述されてい
る。
【0068】なお、声母、韻母共に先頭文字以外は小文
字で記述されているものとする。また、複数の漢字から
なる各単語の読みが連続して記述されているものとす
る。このときファイルから読み込まれたピンイン文字列
はメモリ12に設けられた入力バッファ12bに格納さ
れる。
【0069】ここで、ファイルに記述されたピンイン文
字列の読み込みが終了すると(ステップB12のYe
s)、その読込み終了指示が入力部21を通じて制御部
22に与えられる。これにより、制御部22は入力バッ
ファ12bに格納されたピンイン文字列を変換部23に
送り、上記(a)と同様のピンイン漢字変換処理を実行
する。
【0070】すなわち、変換部23は、まず、ファイル
に記述されたピンイン文字列を各単語の読み毎に声母と
韻母の組合せで区切る(ステップB13)。そして、変
換部23は、各単語の1つ1つに対し、声母の先頭文字
および韻母の先頭文字の字体をそれぞれチェックし、声
調入力規則テーブル25を参照して、それらの字体の組
み合わせから声調の種類を判別する(ステップB14〜
B23)。
【0071】今、図4に示すような声調入力規則が声調
入力規則テーブル25に格納されているものとすると、
声母の先頭文字が大文字、韻母の先頭文字が大文字の場
合に(ステップB15のYes,ステップB17のYe
s)、変換部23は当該単語(1つの漢字)の声調を第
3声と判断する(ステップB18)。
【0072】また、声母の先頭文字が大文字、韻母の先
頭文字が小文字の場合には(ステップB15のYes,
ステップB17のNo)、変換部23は第1声と判断す
る(ステップB19)。声母の先頭文字が小文字、韻母
の先頭文字が大文字の場合には(ステップB15のN
o,ステップB21のYes)、変換部23は第2声と
判断する(ステップB22)。声母の先頭文字が小文
字、韻母の先頭文字が小文字の場合には(ステップB1
5のNo,ステップB21のNo)、変換部23は第4
声と判断する(ステップB23)。
【0073】このようにして、ファイルに記述されたピ
ンイン文字列を各単語毎に声母の先頭文字と韻母の先頭
文字の各字体の組み合わせから声調の種類を判別する。
全ての単語について、声調の種類を判別すると(ステッ
プB24のYes)、変換部23は中国語変換辞書24
を参照して、各単語毎に上記判別された声調の種類とピ
ンイン文字列とに基づいて当該ピンイン文字列を中国語
の漢字に変換し、その変換結果を制御部22に返す(ス
テップB25)。このとき変換結果として得られた各単
語の変換候補は、候補バッファ12cに格納される。
【0074】制御部22は、この候補バッファ12cに
格納された各単語の変換候補を出力部26を通じて表示
装置14に表示する(ステップB26)。この場合、声
調情報によって特定された漢字が変換候補として優先的
に表示されることになる。
【0075】このように、特定のファイルを用いた場合
でも、そのファイルに記述されたピンイン文字列の中の
声母の先頭文字と韻母の先頭文字の各字体の組み合わせ
から四声の種類が判別され、その四声とピンインの2つ
の入力情報に基づいてピンイン漢字変換処理が行なわれ
ることになる。
【0076】したがって、ファイル上で音節の後に数字
あるいは文字が付加されているような場合でも、四声情
報と入力文字との区別して正しい変換結果を得ることが
できる。また、ファイル作成の際に、従来のように四声
情報としての数字あるいは文字の入力を必要としないた
め、ユーザの入力操作を軽減することができる。
【0077】(c)四声入力規則の変更処理 次に、四声入力規則を変更する場合の動作について説明
する。図9は四声入力規則の変更処理の動作を示すフロ
ーチャートである。ユーザが「変更」キーの押下によ
り、四声入力規則の変更を指示すると(ステップC1
1)、その変更指示が入力部21を通じて制御部22に
与えられる。これにより、制御部22は図6に示すよう
な四声入力規則の変更画面30を出力部26を通じて表
示装置14に表示する(ステップC12)。
【0078】この変更画面30には、第1声〜第4声毎
に声母と韻母の各字体(大文字/小文字)の規則を設定
するための設定部31a,31b〜34a,34bと、
確定指示を行なうための「OK」ボタン35および取消
し指示を行なうための「キャンセル」ボタン36が設け
られている。初期画面では、設定部31a,31b〜3
4a,34bに現在設定されている四声入力規則に従っ
た内容がデェフォルト表示される。
【0079】この変更画面30上において、ユーザは四
声入力規則を変更する(ステップC13)。具体的に
は、設定部31a,31b〜34a,34bの設定内容
をマウス等を用いて任意に変更する。この場合、第1声
〜第4声で声母と韻母の各字体(大文字/小文字)の組
み合わせが重ならないように、大文字/小文字を設定す
る。組み合わせが重なるような設定があった場合には、
警告を発するようにしても良い。設定を誤った場合に
は、「キャンセル」ボタン36が押下して設定をやり直
す(ステップC14のYes)。
【0080】設定後、「OK」ボタン35が押されると
(ステップC15のYes)、制御部22はそのときの
設定内容に従って声調入力規則テーブル25に記憶され
た声調入力規則を第1声〜第4声毎に変更する(ステッ
プC16)。これにより、以後、変更後の声調入力規則
に基づいて入力ピンインから声調の種類が判別されるこ
とになる。
【0081】このように、声調入力規則をユーザが任意
に変更することができる。したがって、ユーザが覚えや
すい声調入力規則を設定しておくことで、入力操作の効
率を向上させることができる。
【0082】なお、上記実施形態では、大文字/小文字
の組み合わせによって四声の種類を判別する入力規則を
定義したが、本発明はこれに限るものではなく、全角、
半角、斜体などの他の字体を利用して、四声の種類を判
別する入力規則を定義することもできる。例えば全角と
半角の字体を利用した場合には、以下のような入力規則
となる。
【0083】声母:全角文字,韻母:半角文字…第1声 声母:半角文字,韻母:全角文字…第2声 声母:全角文字,韻母:全角文字…第3声 声母:半角文字,韻母:半角文字…第4声 この他、例えば声母と韻母を色分けし、その色の組み合
わせによって上記のような入力規則を定義することも可
能である。
【0084】また、上述した実施形態において記載した
手法は、コンピュータに実行させることのできるプログ
ラムとして、例えば磁気ディスク(フロッピーディス
ク、ハードディスク等)、光ディスク(CD−ROM、
DVD等)、半導体メモリなどの記録媒体に書き込んで
各種装置に適用したり、通信媒体により伝送して各種装
置に適用することも可能である。本装置を実現するコン
ピュータは、記録媒体に記録されたプログラムを読み込
み、このプログラムによって動作が制御されることによ
り、上述した処理を実行する。
【0085】
【発明の効果】以上のように本発明によれば、ピンイン
文字列の各字体から声調の種類を判別し、その四声の種
類とピンインの2つの入力情報に基づいてピンイン漢字
変換処理を行うようにしたため、音節の後に数字あるい
は文字が付加されているような場合でも、四声情報と入
力文字との区別して正しい変換結果を得ることができ
る。また、声母および韻母からなるピンイン文字列の他
には、四声情報としての数字あるいは文字の入力を必要
としないため、ユーザの入力操作を軽減することができ
る。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る中国語入力変換処理
装置のシステム構成を示すブロック図。
【図2】上記図1のシステム構成によって実現される中
国語入力変換処理装置の機能構成を示すブロック図。
【図3】同実施形態における中国語変換辞書の構成を示
す図。
【図4】同実施形態における声調入力規則テーブルの構
成を示す図。
【図5】同実施形態における声調付きピンイン入力方法
を説明するための図。
【図6】同実施形態における声調入力規則の変更画面を
示す図。
【図7】同実施形態におけるユーザ入力によるピンイン
の変換処理の動作を示すフローチャート。
【図8】同実施形態におけるファイルを用いたピンイン
の変換処理の動作を示すフローチャート。
【図9】同実施形態における四声入力規則の変更処理の
動作を示すフローチャート。
【図10】従来の声調記号を併用したピンイン入力方法
を説明するための図。
【図11】従来の声調入力規則を用いたピンイン入力方
法を説明するための図。
【図12】従来のピンイン入力方法での問題点を説明す
るための図。
【符号の説明】
11…CPU 12…メモリ 12a…プログラム領域 12b…入力バッファ 12c…候補バッファ 12d…文書バッファ 13…入力装置 14…表示装置 15…外部記憶装置 16…印刷装置 17…通信装置 21…入力部 22…制御部 23…変換部 24…中国語変換辞書 25…声調入力規則テーブル 26…出力部 30…変更画面 31a,31b…第1声用設定部 32a,32b…第2声用設定部 33a,33b…第3声用設定部 34a,34b…第4声用設定部 35…「OK」ボタン 36…「キャンセル」ボタン

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 中国語の漢字の読みを示すピンインを入
    力し、その入力されたピンインを漢字に変換する中国語
    入力変換処理装置であって、 ピンイン文字列を入力する入力手段と、 各単語毎にピンインおよび声調情報とそれに対応する漢
    字とを記憶した変換辞書と、 ピンイン文字列の各文字の字体によって声調の種類を定
    義した声調入力規則を記憶した入力規則記憶手段と、 この入力規則記憶手段に記憶された声調入力規則を参照
    して、上記入力手段によって入力されたピンイン文字列
    をチェックし、そのピンイン文字列の各文字の字体から
    声調の種類を判別する声調判別手段と、 この声調判別手段によって判別された声調の種類と上記
    入力されたピンイン文字列とに基づいて上記変換辞書を
    検索し、当該ピンイン文字列を漢字に変換する変換手段
    と、 この変換手段によって得られた漢字を変換結果として出
    力する出力手段とを具備したことを特徴とする中国語入
    力変換処理装置。
  2. 【請求項2】 中国語の漢字の読みを示すピンインを入
    力し、その入力されたピンインを漢字に変換する中国語
    入力変換処理装置であって、 ピンイン文字列が記述されたファイルを読み込むファイ
    ル読込み手段と、 各単語毎にピンインおよび声調情報とそれに対応する漢
    字とを記憶した変換辞書と、 ピンイン文字列の各文字の字体によって声調の種類を定
    義した声調入力規則を記憶した入力規則記憶手段と、 この入力規則記憶手段に記憶された声調入力規則を参照
    して、上記ファイル読込み手段によって読み込まれたフ
    ァイルに記述されたピンイン文字列をチェックし、その
    ピンイン文字列の各文字の字体から声調の種類を判別す
    る声調判別手段と、 この声調判別手段によって判別された声調の種類と上記
    ファイルに記述されたピンイン文字列とに基づいて上記
    変換辞書を検索し、当該ピンイン文字列を漢字に変換す
    る変換手段と、 この変換手段によって得られた漢字を変換結果として出
    力する出力手段とを具備したことを特徴とする中国語入
    力変換処理装置。
  3. 【請求項3】 上記入力規則記憶手段には、ピンイン文
    字列の声母の先頭文字と韻母の先頭文字の各字体の組み
    合わせによって声調の種類を定義した声調入力規則が記
    憶されており、 上記声調判別手段は、この声調入力規則を参照してピン
    イン文字列から声調の種類を判別することを特徴とする
    請求項1または請求項2記載の中国語入力変換処理装
    置。
  4. 【請求項4】 上記声母の先頭文字と韻母の先頭文字の
    各字体の組み合わせとは、アルファベットの大文字と小
    文字の組み合わせであることを特徴とする請求項3記載
    の中国語入力変換処理装置。
  5. 【請求項5】 規則変更指示により、上記入力規則記憶
    手段に記憶された声調入力規則を変更する規則変更手段
    をさらに具備したことを特徴とする請求項1または請求
    項2記載の中国語入力変換処理装置。
  6. 【請求項6】 中国語の漢字の読みを示すピンインを入
    力し、その入力されたピンインを漢字に変換する中国語
    入力変換処理方法であって、 ピンイン文字列の各文字の字体によって声調の種類を判
    別するための声調入力規則を定義しておき、 ピンイン文字列を入力し、 上記声調入力規則を参照して上記入力されたピンイン文
    字列の各文字の字体から声調の種類を判別し、 この声調の種類と上記入力されたピンイン文字列とに基
    づいて、各単語毎にピンインおよび声調情報とそれに対
    応する漢字とを記憶した変換辞書を検索し、当該ピンイ
    ン文字列を漢字に変換し、 この変換によって得られた漢字を変換結果として出力す
    ることを特徴とする中国語入力変換処理方法。
  7. 【請求項7】 中国語の漢字の読みを示すピンインを入
    力し、その入力されたピンインを漢字に変換する中国語
    入力変換処理方法であって、 ピンイン文字列の各文字の字体によって声調の種類を判
    別するための声調入力規則を定義しておき、 ピンイン文字列が記述されたファイルを読み込み、 上記声調入力規則を参照して上記ファイルに記述された
    ピンイン文字列の各文字の字体から声調の種類を判別
    し、 この声調の種類と上記ファイルに記述されたピンイン文
    字列とに基づいて、各単語毎にピンインおよび声調情報
    とそれに対応する漢字とを記憶した変換辞書を検索し、
    当該ピンイン文字列を漢字に変換し、 この変換によって得られた漢字を変換結果として出力す
    ることを特徴とする中国語入力変換処理方法。
  8. 【請求項8】 中国語の漢字の読みを示すピンインを入
    力し、その入力されたピンインを漢字に変換する中国語
    入力変換処理プログラムを記録した記録媒体であって、 ピンイン文字列の各文字の字体によって声調の種類を判
    別するための声調入力規則が定義されており、 ピンイン文字列を入力させる手順と、 上記声調入力規則を参照して上記入力されたピンイン文
    字列の各文字の字体から声調の種類を判別させる手順
    と、 この声調の種類と上記入力されたピンイン文字列とに基
    づいて、各単語毎にピンインおよび声調情報とそれに対
    応する漢字とを記憶した変換辞書を検索し、当該ピンイ
    ン文字列を漢字に変換させる手順と、 この変換によって得られた漢字を変換結果として出力さ
    せる手順とをコンピュータに実行させるプログラムを記
    録したコンピュータ読取り可能な記録媒体。
  9. 【請求項9】 中国語の漢字の読みを示すピンインを入
    力し、その入力されたピンインを漢字に変換する中国語
    入力変換処理プログラムを記録した記録媒体であって、 ピンイン文字列の各文字の字体によって声調の種類を判
    別するための声調入力規則が定義されており、 ピンイン文字列が記述されたファイルを読み込ませる手
    順と、 上記声調入力規則を参照して上記ファイルに記述された
    ピンイン文字列の各文字の字体から声調の種類を判別さ
    せる手順と、 この声調の種類と上記ファイルに記述されたピンイン文
    字列とに基づいて、各単語毎にピンインおよび声調情報
    とそれに対応する漢字とを記憶した変換辞書を検索し、
    当該ピンイン文字列を漢字に変換させる手順と、 この変換によって得られた漢字を変換結果として出力さ
    せる手順とをコンピュータに実行させるプログラムを記
    録したコンピュータ読取り可能な記録媒体。
JP9346375A 1997-12-16 1997-12-16 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体 Pending JPH11175511A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9346375A JPH11175511A (ja) 1997-12-16 1997-12-16 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9346375A JPH11175511A (ja) 1997-12-16 1997-12-16 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体

Publications (1)

Publication Number Publication Date
JPH11175511A true JPH11175511A (ja) 1999-07-02

Family

ID=18383002

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9346375A Pending JPH11175511A (ja) 1997-12-16 1997-12-16 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JPH11175511A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007052549A (ja) * 2005-08-16 2007-03-01 Kyoto Institute Of Technology 文字変換装置、文字変換装置を備えた携帯機器、文字変換方法、文字変換プログラム、及び文字変換プログラムを記録したコンピュータ読み取り可能な記録媒体
US7912697B2 (en) 2003-11-20 2011-03-22 Sharp Kabushiki Kaisha Character inputting method and character inputting apparatus
CN117875267A (zh) * 2024-03-11 2024-04-12 江西曼荼罗软件有限公司 一种汉字转拼音的方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7912697B2 (en) 2003-11-20 2011-03-22 Sharp Kabushiki Kaisha Character inputting method and character inputting apparatus
JP2007052549A (ja) * 2005-08-16 2007-03-01 Kyoto Institute Of Technology 文字変換装置、文字変換装置を備えた携帯機器、文字変換方法、文字変換プログラム、及び文字変換プログラムを記録したコンピュータ読み取り可能な記録媒体
CN117875267A (zh) * 2024-03-11 2024-04-12 江西曼荼罗软件有限公司 一种汉字转拼音的方法及系统
CN117875267B (zh) * 2024-03-11 2024-05-24 江西曼荼罗软件有限公司 一种汉字转拼音的方法及系统

Similar Documents

Publication Publication Date Title
JP5513898B2 (ja) 共有された言語モデル
JP2002014954A (ja) 中国語入力変換処理装置、中国語入力変換処理方法及び記録媒体
JP2010520531A (ja) 統合ピンイン及び画入力
JPH11338858A (ja) 入力予測装置、入力予測方法及び入力予測プログラムを記録した記録媒体
JP2010520532A (ja) 画数の入力
JPH11175511A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
JP2001014304A (ja) 文書作成装置、変換処理方法及び変換処理プログラムを記録した記録媒体
JP2002297577A (ja) 中国語入力変換処理装置、中国語入力変換処理方法及びプログラム
JP2001109740A (ja) 中国語文書作成装置及び中国語文書作成方法
JP3847801B2 (ja) 文字処理装置及びその処理方法
US20250103791A1 (en) Structuring device, structuring method, and structuring program
JPH11161641A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
JP2000003355A (ja) 中国語入力変換処理装置、同装置に用いられる新語登録方法及び記録媒体
JP2001229155A (ja) 中国語入力変換処理装置、中国語入力変換処理方法及び記録媒体
JPH11328160A (ja) 文字コード変換処理装置、文字コード変換処理方法、文字コード変換処理プログラムを記録した記録媒体
JPH11328159A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
JP2026036528A (ja) 言語変換装置、言語変換方法、及び、プログラム
JPH1196141A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
JP3847869B2 (ja) 文字列変換装置及び方法
JPH08161320A (ja) 文書作成装置及びその表示処理方法
JPH08272780A (ja) 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法
JPH11203279A (ja) かな漢字変換装置、かな漢字変換方法、及び記憶媒体
JP3566873B2 (ja) 仮名漢字変換装置及び方法並びに仮名漢字変換プログラムを記憶した記憶媒体
JPH11224248A (ja) 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体
JPH0267676A (ja) 漢数字変換処理装置