JPH03282961A - 相互変換辞書方式 - Google Patents

相互変換辞書方式

Info

Publication number
JPH03282961A
JPH03282961A JP2084409A JP8440990A JPH03282961A JP H03282961 A JPH03282961 A JP H03282961A JP 2084409 A JP2084409 A JP 2084409A JP 8440990 A JP8440990 A JP 8440990A JP H03282961 A JPH03282961 A JP H03282961A
Authority
JP
Japan
Prior art keywords
kanji
conversion
kana
character string
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2084409A
Other languages
English (en)
Inventor
Koichi Hayasaka
公一 早坂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Home Electronics Ltd
NEC Corp
Original Assignee
NEC Home Electronics Ltd
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Home Electronics Ltd, Nippon Electric Co Ltd filed Critical NEC Home Electronics Ltd
Priority to JP2084409A priority Critical patent/JPH03282961A/ja
Publication of JPH03282961A publication Critical patent/JPH03282961A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、かな文字列から漢字文字列を検索すると同時
に、逆に漢字文字列から読みがなをも検索することが可
能な相互変換辞書方式に関する。
また、相互の検索が可能なことから、英訳、和訳など語
学辞書としての機能を有する相互変換辞書方式に厨する
従来の技術 従来のかな漢字変換辞書方式においては、かな文字列か
ら漢字文字列を検索することのみに利用される辞書構造
となっている。
また、漢字文字列の再変換機能においては、はじめに漢
字文字列に変換した後も、元のかな文字列情報がメモリ
に残っていて、再びかな文字列から漢字文字列に変換す
るというような構造になっている。
発明が解決しようとする課題 上述した変換辞書方式において、一方向の検索辞書とし
てしか使用されず、再変換機能においても、かな文字列
情報が残っていることがら、メモリ効率が非常に悪い。
従って、漢字文字列とがな文字列の相互の検索を可能に
することが望ましいが、このためには、それぞれ別々の
辞書を使用しなければならず、辞書メモリサイズが約2
倍に膨れるという問題点がある。
本発明は、かかる点に鑑みてなされたもので、その目的
とするところは、かな漢字変換辞書における仕様拡張と
ともに、メモリ効率の向上を実現する相互変換辞書方式
を提供することにある。
課題を解決するための手段 本発明は、かな文字列から漢字文字列を検索すると同時
に、逆に漢字文字列から読みがなをも検索することが可
能な二重構造を有し、ほぼ一つ分のメモリサイズで上記
二種類の構造をもつ変換辞書を有した構成としている。
実施例 以下、本発明を一実施例に従って説明する。
まず、本発明と従来の技術とをフローチャート図を使っ
て比較する。
第5図は、従来のかな漢字変換方式のフローチャート図
で、先ずステップ(11)において、日本語エディタで
様々なキー人力を行なう。
次に、かな文字を入力しくステップ(12)) 、変換
用バッファにかな文字コードをセットする(ステップ(
13))。さらに再変換用バッファにかな文字コードを
セット(ステップ(14)) L、次いでステップ(1
5)の日本語変換処理を経て、漢字辞書検索を行ない、
変換候補を得た(ステップ(16))後に、日本語エデ
ィタにより、その候補の漢字コードから漢字文字列を出
力する(ステップ(17))。
第6図は従来の漢字文字列再変換方式のフローチャート
図で、第5図に示す処理により漢字に変換した文字列が
、ステップ(21)の日本語エディタ上に表示されてい
る。ここで、ステップ(22)で再変換すべき漢字文字
列を指定して、ステップ(24)で指定した漢字文字列
に対するかな文字コードがバッファに存在するかをチエ
ツクし、なければ、ステップ(23)でエラー表示をし
、始めに戻る。
一方、対応するかな文字コードがあれば、ステップ(2
5)で変換用バッファにかな文字コードをセットする。
次の処理リステップ(26)、(27)、(28)につ
いては、通常の変換と全く同処理を行う。
このように、従来の技術では再変換しようとする際に、
再変換用のかな文字バッファが必要となり、またこの文
字バッファに対応するかな文字コードがなければ再変換
不可能となる。
従って、全ての漢字文字列に対して再変換可能状態にす
るためには、極めて多くのメモリを必要とし、限られメ
モリ資源の有効活用という観点からすると、非常に非効
率的な方法となるという問題点がある。
そこで本発明では、第3図にフローチャート図で示すよ
うな相互変換辞書方式を用いて日本語変換を行うもので
ある。
まず、ステップ(31)の日本語エディタ上で、かな文
字列を入力するか、もしくは再変換すべき漢字を指定す
る(ステップ(32))。ここで、変換バッファにセッ
トされた(ステップ(33))文字列タイプが、かな文
字なのか漢字文字なのかを判断しくステップ(34))
 、かな文字であればステップ(35)の漢字変換処理
により、漢字検索を行ない、変換候補を得る(ステップ
(36))。
一方、漢字文字であれば、ステップ(41)の読みがな
変換処理により、読みがな検索を行ない、変換候補を得
る(ステップ(42))。
それぞれの変換候補は、日本語エディタにより、ステッ
プ(37)の漢字文字列、もしくはステップ(43)の
かな文字列に出力される。
このように、本発明においては変換時に漢字変換するの
か、読みがな変換するのかを選択することができ、相互
兼用辞書を使用することにより、メモリの使用効率に優
れた日本語変換方式が実現可能となる。
第2図は、本発明の相互兼用辞書の一実施例構造を示し
ている。
この辞書は、辞書インデックス部(101)との辞書デ
ータ部(102)の2つに分類される。辞書インデック
ス部(101)においては、まず漢字変換ディレクトリ
の先頭アドレス(103)を持ち、読みがなディレクト
リの先頭アドレス(104)と並ぶ。
また(105)は、辞書データ部(102)の先頭アド
レスを示し、(109)は辞書ブロック1の開始アドレ
スを表す。
ここで(106)には、漢字表記などの情報が入ってい
る。また、(107)には漢字変換の各ブ白ツクの先頭
アドレスと、かな見出しが入っている。そして(108
)には、読みがな変換の各ブロックの先頭アドレスと、
漢字見出しが入っている。
実際には読みがなブロックの各データは、各々の漢字ブ
ロックに不規則に位置しているが、各データに読みがな
変換のための属性とシリアル番号がついて、ブロック分
けを可能にしている。(109)は、それぞれの漢字変
換のためのグループ分けをブロック化している。このブ
ロック化は漢字変換のためのみ構成しているもので、読
みがな変換のためのブロック化は表面上、不規則である
第3図は、相互兼用辞書のデータ構造を示している。
すなわち、品詞情報(201)が先頭にあり、(202
)の漢字文字数と、(203)のかな文字数が並んでい
る。次に、カナ見出しく204)が入っていて、1バイ
1〜カナコードで表現されている。(205)には漢字
文字列データがセットされていて、2バイト漢字コード
で表している。(206)は、次候補の読みがな候補が
ある漢字ブロック番号がセットされ(207)はそのブ
ロックの先頭から何バイト目にあるかを表している。(
208)は、次候補があるかどうかの情報が入っている
。(209)と(210)には、読みがな辞書としての
属性は入っていて、読みがなブロック番号や漢字分類番
号を表す。
第4図は、読みがな辞書検索のフローチャート図である
まず、ステップ(61)でディレクトリの先頭アドレス
を第2図に示す(104)から得て、ステップ(62)
で読みがな変換処理する漢字が、どの読みがなブロック
に属するかを第2図に示す(108)から調べる。
次に、そのブロックの先頭のアドレスを求め、ステップ
(64)で候補があるかどうかを調べる。
ここで候補があれば、第1図に示すステップ(31)の
日本語エディタ上で指定(ステップ(32)) した変
換文字列の長さを求め(ステップ(65)) 、候補見
出しと漢字文字列の長さを比較する(ステップ(66)
)。
次いで、ステップ(67)で長さが等しいか否かを判断
し、長さが等しければ、漢字コードを比較して(ステッ
プ(68)) 、一致したならば(ステップ(69))
 、辞書の漢字文字数と、日本語エディタで指定した漢
字文字数とが一致したかを調べる(ステップ(70))
このとき一致したならば、読みがな検索成功である。そ
こで、検索したかな文字コードを出力バッファにセット
しくステップ(74)) 、日本語エディタに戻り、読
みがな文字列を出力する。
発明の詳細 な説明したように本発明の相互兼用辞書方式によれば、
かな漢字変換のみならず、読みがな変換も一つの辞書で
使用可能になり、変換時にどちらの変換をするかを選択
的に実行可能となる。
また、変換のために必要なメモリ資源も、大幅に節約で
き、その使用効率は大きく向上する。
【図面の簡単な説明】
第1図は本発明の一実施例相互変換辞書方式を用いた日
本語変換処理のフローチャート図、第2図は本発明の一
実施例相互変換辞書の構造図、第3図は相互変換辞書の
データ構造図、第4図は読みがな辞書検索処理のフロー
チャート図、第5図は従来のかな漢字変換処理のフロー
チャート図、第6図は従来の漢字文字列再変換処理のフ
ローチャート図である。

Claims (1)

    【特許請求の範囲】
  1. かな文字列から漢字文字列を検索すると同時に、逆に漢
    字文字列から読みがなをも検索することが可能な二重構
    造を有し、ほぼ一つ分のメモリサイズで上記二種類の構
    造をもつ変換辞書を備えた相互変換辞書方式。
JP2084409A 1990-03-30 1990-03-30 相互変換辞書方式 Pending JPH03282961A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2084409A JPH03282961A (ja) 1990-03-30 1990-03-30 相互変換辞書方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2084409A JPH03282961A (ja) 1990-03-30 1990-03-30 相互変換辞書方式

Publications (1)

Publication Number Publication Date
JPH03282961A true JPH03282961A (ja) 1991-12-13

Family

ID=13829793

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2084409A Pending JPH03282961A (ja) 1990-03-30 1990-03-30 相互変換辞書方式

Country Status (1)

Country Link
JP (1) JPH03282961A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0488550A (ja) * 1990-07-31 1992-03-23 Canon Inc 文字処理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0488550A (ja) * 1990-07-31 1992-03-23 Canon Inc 文字処理装置

Similar Documents

Publication Publication Date Title
JP3152868B2 (ja) 検索装置および辞書/テキスト検索方法
US6877003B2 (en) Efficient collation element structure for handling large numbers of characters
US5383121A (en) Method of providing computer generated dictionary and for retrieving natural language phrases therefrom
JPH09179872A (ja) 有限状態トランスデューサを用いてデータベースのインデックス付けを行う方法及び装置
KR100288144B1 (ko) 한글로 표기된 외래어 코드화 방법 및 그를 이용한 검색 방법
JPH03282961A (ja) 相互変換辞書方式
JP3253657B2 (ja) 文書検索方法
JP2785168B2 (ja) 単語検索のための電子辞書圧縮方法及び装置
JPH03116375A (ja) 情報検索装置
JPH0227423A (ja) 日本語文字データの並び換え方法
JPH0140372B2 (ja)
JPS6057421A (ja) 文書作成装置
JPH0140370B2 (ja)
JP2000259629A (ja) 形態素解析方法およびその装置
JPH0612550B2 (ja) デ−タ検索方式
KR100289332B1 (ko) 전자화된 문서의 어절 데이터베이스 자동 구축장치 및 방법
JPH03127254A (ja) 単語検索装置
JPS6198475A (ja) 日本語文章入力装置
JPS62214468A (ja) かな漢字変換装置
JP2773657B2 (ja) 文字列検索装置
JP4061283B2 (ja) 字句をデータに変換する装置、方法及びプログラム
JPH0721212A (ja) 文書処理装置
JPS5965344A (ja) 単語検索装置
JPS61210473A (ja) 文書作成装置
JPS61285573A (ja) 仮名漢字変換装置