JPH0765018A - キーワード自動抽出装置 - Google Patents

キーワード自動抽出装置

Info

Publication number
JPH0765018A
JPH0765018A JP5216784A JP21678493A JPH0765018A JP H0765018 A JPH0765018 A JP H0765018A JP 5216784 A JP5216784 A JP 5216784A JP 21678493 A JP21678493 A JP 21678493A JP H0765018 A JPH0765018 A JP H0765018A
Authority
JP
Japan
Prior art keywords
keyword
unit
evaluation
extraction
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5216784A
Other languages
English (en)
Inventor
Satoru Ito
哲 伊藤
Toshio Niwa
寿男 丹羽
Kazuhiro Kayashima
一弘 萱嶋
泰治 〆木
Taiji Shimeki
Hidetsugu Maekawa
英嗣 前川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP5216784A priority Critical patent/JPH0765018A/ja
Publication of JPH0765018A publication Critical patent/JPH0765018A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 用途や使用者の好みなど目的に応じた尤度の
高いキーワードの自動抽出とそのシステムの設計作業の
軽減を可能とすること。 【構成】 キーワード抽出手段3が複数のキーワード抽
出パラメータ8に基づいて文書から抽出したキーワード
4をキーワード評価手段5が人の指定するキーワードと
比較して評価し、その評価値を最大化するようにパラメ
ータ最適化手段7が複数のキーワード抽出パラメータの
組合せと重みを最適化する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ワードプロセッサ、日
本語文書解析装置やキーワード抽出装置など、文章から
意味を持つ文字列の抽出処理が必要な、キーワード抽出
装置に関するものである。
【0002】
【従来の技術】従来のキーワード抽出装置は、対象とな
る文書を形態素解析し、得られた単語の出現頻度や文法
的な関係などの情報を手がかりとして、様々な文字列の
抽出・作成のためのルールを駆使してキーワード抽出を
行なっている。すなわちキーワード抽出は入力された文
字列を様々なルールで加工することである。
【0003】従来例として、特に複合語のキーワードを
頻度情報から作成する特開平3−116374号公報に
示された専門用語抽出システムについて以下に説明す
る。これは、文章中からすべての複合語を抽出し、複合
語の構成語の出現頻度と単語結合数から、特定の構成語
を専門用語特徴語基として複合語から抽出し、その語基
を含む複合語をすべてキーワードとするものである。
【0004】図7は、上記の従来例の専門用語抽出シス
テム構成を示すもので、入力文章71を入力とする形態
素解析部72と、複合語抽出部73と、専門用語特徴語
基抽出部74と、専門用語抽出部75による処理を順に
行なうように構成されている。
【0005】形態素解析部72は任意の分野の入力文書
について、語の単位と品詞を認定する形態素解析を行な
う。複合語抽出部73は形態素解析結果に対して名詞、
形容動詞、接辞の連続を複合語として抽出する複合語抽
出を行い、入力文章71中の複合語をすべて抽出する。
専門用語特徴語基抽出部74では抽出された複合語に対
して、その構成語なる主語基が専門用語をなす語基であ
るかどうかを評価値を用いて判断し、専門用語をなす語
基だけを抽出する専門用語特徴語基抽出処理を行なう。
ついで、専門用語抽出部75では、抽出された複合語中
から、専門用語特徴語基と判定された語を語基とするも
のだけを専門用語として抽出する処理を行なう。
【0006】ここに、専門用語特徴語基抽出部74によ
る処理の概要を図8により説明する。前述した複合語抽
出部73により抽出された複合語リスト76中の複合語
に対して、まず、語末に位置する主語基の頻度を算出す
る。次に、各主語基の入力文書71内での平均結合数を
計算する。これは、ある語を主語基とする時に、その前
に付く修飾語の数を、1つの語基あたりについて計算す
るものである。主語基の頻度と平均結合数から評価値を
算出し、ある閾値以上であればその語を専門用語特徴語
基と判定するものである。
【0007】これらのキーワード抽出に適用されるルー
ルやその強さを決定するパラメータは、目的に応じ設計
者により選択、調整される。
【0008】
【発明が解決しようとする課題】しかしながら、これら
パラメータの調整作業はキーワード抽出装置の設計者に
よる試行錯誤的かつ主観的評価に基づいて行われるた
め、設計者の負担が多いことや、設計者と使用者とのキ
ーワード評価の不一致が見られることなどが問題であっ
た。
【0009】個々のキーワード抽出ルールの妥当性は、
組合せ方や使用者の目的によって変化し、また、自然言
語としてのキーワードが本来持っている意味の曖昧性な
どの問題により尤度の高いキーワードの自動抽出は困難
であった。
【0010】また、人によるキーワード評価自体にも先
入観や矛盾などの問題があり、キーワード抽出の熟練者
でない場合、評価の妥当性も低く、したがって得られる
キーワードの尤度は低い。
【0011】本発明は、このような従来のキーワード抽
出装置の課題を考慮し、キーワード抽出のルールやパラ
メータを自動的かつ簡便に最適化できるキーワード自動
抽出装置を提供することを目的とするものである。
【0012】
【課題を解決するための手段】本発明は、入力文書から
キーワード抽出パラメータに従ってキーワードを抽出す
るキーワード抽出手段と、キーワードの尤度を演算する
キーワード評価手段と、キーワード評価値を最大化する
ようにキーワード抽出パラメータを設定するパラメータ
最適化手段とを備えたキーワード自動抽出装置である。
【0013】
【作用】本発明は、キーワード抽出パラメータのちがい
により様々なキーワードを抽出することのできるキーワ
ード抽出手段によって、目的に合わせた汎用性の高いキ
ーワード抽出が可能となり、さらに、自動抽出されたキ
ーワードの尤度を数値化するキーワード評価手段により
効率的なキーワードの校正および客観的評価が可能とな
り、さらに、パラメータ最適化手段によりキーワード評
価値を最大化するようなパラメータを効率的に探索する
ことにより試行錯誤に依らないキーワード自動抽出装置
の性能向上が可能となる。
【0014】
【実施例】以下、本発明の実施例について図面を参照し
て説明する。
【0015】本発明の一実施例にかかるキーワード自動
抽出装置は図1に示すとおり、キーワード抽出パラメー
タ8に従い入力文書1から得られる文字列2よりキーワ
ード候補4を抽出するキーワード抽出手段3と、入力さ
れたキーワード候補4の尤度を評価してキーワード評価
値6の出力とキーワード10の出力を行うキーワード評
価手段5と、キーワード評価値6を最大化するようにキ
ーワード抽出パラメータ8を変更設定するパラメータ最
適化手段7で構成されている。
【0016】ここにキーワード抽出手段3による処理の
概要を図2により説明する。図2において、キーワード
抽出手段3は、形態素解析部21とキーワード候補作成
部22のそれぞれの処理を順に行うように構成されてい
る。形態素解析部21は、入力文書1より得られる文字
列2について、辞書26を用いて解析する。得られた形
態素情報27はキーワード候補作成部22に送られ、キ
ーワード候補の作成基準として使用される。
【0017】次にキーワード候補作成部22は、文字列
2より形態素情報27とキーワード作成ルールを元にキ
ーワード候補を抽出する。形態素解析部21で用いる形
態素解析ルールとキーワード候補作成部22において用
いるキーワード作成ルールは、パラメータ制御部23か
らの指示により決定される。キーワード抽出処理の手順
は、これらの指示されたルールによって変化するが、そ
の一例を次に示す。まず入力された文書中に「索引語を
自動抽出する。」という文があるとすると、これを文の
最小単位である単語「索引語/を/自動/抽出/す
る。」に分解する。通常、キーワードは名詞単語である
ため、辞書26は「索引語、自動、抽出」などの名詞単
語を文字の表記と品詞の情報を持ち、この辞書との照合
により名詞単語を分離する。ここで単語「索引語」が文
書全体に高頻度に出現している場合に、「文中での出現
頻度が高い単語をキーワードとする」というルールを適
用するならば、名詞単語「索引語」がキーワードとして
選択され易くなる。また、辞書26にシソーラス情報や
類義語、専門用語などを入れることにより、文章中に現
れない単語をキーワード候補として作成してもよい。こ
れは例えば、「索引語」の代わりに「キーワード」とい
う表現を使えるということである。
【0018】これらのキーワード抽出に関するルール
は、統計情報(単語の文中の出現頻度や一般的な使用頻
度、文字列の長さなど)や、文字情報(文字種、網かけ
や下線の文字修飾など)文字情報、文書中での位置情報
(題名、文頭、段落はじめ)、意味情報(未知語か登録
語か、シソーラスの上下関係、分野、修飾関係)などを
元にして作成し、ルール保存部24に記憶させておく。
例えば、統計情報によるルールの例としては、「出現頻
度が高い単語のキーワード評価値を上げる。」や、「一
般的に使われることの多い単語はキーワード評価値を下
げる。」などが挙げられる。このとき評価値をどのくら
い上下させるかもパラメータ制御部23からの指示によ
って決定される。
【0019】このような複数のキーワード抽出ルールの
組合せによって形態素解析とキーワード候補作成を行な
うが、ルール作成支援部25は抽出されたキーワード候
補と使用された抽出ルールの関係を表示することによ
り、人手によるルール作成の支援を可能にする。ここ
に、ルール保存部24とルール作成支援部25の処理を
図5により説明する。パラメータ制御部23が指示した
ルールに従い形態素解析部21とキーワード候補作成部
22により処理された結果は、使用されたルールとの相
関関係を含めてルール作成支援部25のルール表示部5
1に表示される。ここで使用者はルール表示部51より
得られる情報を基にルールの矛盾や不足を判断し、ルー
ル入力部52に新規のルールを記述する。新規のルール
はルール保存部24の抽出ルール記録部53に記録され
パラメータ制御部23からの要請に応じて抽出ルール選
択部54に送られキーワード抽出処理ルールとして使用
される。使用された結果は再びルール表示部51に表示
されるため、新規追加ルールの動作や効果は使用者の知
るところとなる。このように局所的なループを構成する
ことにより、妥当性の高いキーワード抽出ルールの追加
が可能となる。
【0020】次に、キーワード評価手段5による処理の
概要を図3により説明する。図3において、キーワード
評価手段5は入力されたキーワード候補4を情報表示部
31とキーワード決定部33に送り、さらにキーワード
決定部33では教師入力32によりキーワード10を出
力し、処理結果を評価値演算部34に送ることによりキ
ーワード評価値6を出力するように構成されている。入
力されるキーワード候補4は文字列のみならず形態素や
抽出ルールに関する情報をも含むため、情報表示部31
における使用者によるキーワードの評価支援が可能であ
る。使用者は評価結果を教師入力部32を通じてキーワ
ード決定部33に送ることにより、キーワード10の最
終的な決定と、次に送られる評価値演算部34でのキー
ワード評価値の算出に使用される。
【0021】ここに、教師入力部32における処理を図
6により説明する。キーワード抽出手段3から出力され
たキーワード候補の情報は情報表示部31を介して使用
者に分かりやすく提示される。この情報を基に使用者は
比較評価部61、キーワード順序評価部62、キーワー
ド校正部63のいずれか又はそれらを組み合わせて使用
することによりキーワード候補の尤度評価を行なう。
【0022】比較評価部61は、キーワード入力部60
に入力された使用者が抽出したキーワード文字列をキー
ワード抽出手段3が抽出したキーワード候補文字列と照
合し、一致する点が多いほど評価を高くする。キーワー
ド順序評価部62は、情報表示部31にキーワード抽出
手段3が尤度順に出力したキーワード文字列を使用者の
考える尤度順に並べ変えることにより評価を反映させる
もので、並べ変えが少ないほどキーワードの尤度が高い
とするものである。キーワード校正部63は、キーワー
ド候補文字列に使用者が修正、削除、追加などの校正を
加えることによりキーワード評価を実現しようとするも
のである。校正が少ないほどキーワードとしての尤度は
高いということになり、かつ校正された尤度の高いキー
ワードを得ることが出来る。
【0023】評価結果は評価尺度選択部64を介してキ
ーワード決定部33におけるキーワード決定要素として
採用される。また、評価結果および得られる人手による
キーワードを評価尺度保存部65に目的(使用者・用
途)別に保存することにより、必要に応じ評価尺度選択
部64が呼び出し利用することも出来る。
【0024】次にパラメータ最適化手段7による処理の
概要を図4により説明する。図4において、パラメータ
最適化手段7はキーワード評価手段5より入力されるキ
ーワード評価値6を基にパラメータ最適化部においてキ
ーワード抽出パラメータ8を最適化し、キーワード抽出
手段3に出力する構成となっている。また、最適化され
たパラメータはパラメータ保存部42に保存され、目的
に応じてパラメータ最適化部41と初期値設定部43に
呼び出されるような構成からなっている。ここでいうパ
ラメータとはキーワード抽出手段3の動作を一意に決定
するキーワード抽出ルールの組み合せおよびそれぞれの
強さを示すものである。
【0025】ここでパラメータ最適化手段7における動
作を遺伝的アルゴリズムを使用した場合を例にとり具体
的に説明する。まず、初期パラメータ候補として、キー
ワード抽出ルールの組み合せおよびそれぞれの強さが様
々な状態のものを初期値設定部43に複数組をセットす
る。これらパラメータ候補群はパラメータ保存部42か
ら過去に他の目的用に保存したパラメータを呼び出すこ
とにより設定してもよいが、ランダムに様々な値にパラ
メータを変化させたものを設定してもよい。次にパラメ
ータ候補のそれぞれについてキーワード抽出手段3に出
力し、さらにキーワード評価手段5を経てキーワード評
価値6としてパラメータ候補の評価を行なう。このよう
にしてパラメータ候補それぞれについてキーワード評価
値6が得られる。
【0026】次にパラメータ最適化部41において、相
対的に評価値が高いパラメータの内容を反映したパラメ
ータを新規に設定することにより、評価値を最大化する
パラメータの組合せを決定する。具体的には確率的に評
価値の高いもの同士のパラメータの一部を交換して、新
たなパラメータの組合せを作成し、その分評価値の低い
組合せをパラメータ候補群から削除することにより、パ
ラメータ候補群の平均評価値を高めていく方向に駆動す
るのである。これを繰り返すことにより、最終的に評価
値を最大化するパラメータ候補が得られ、使用者の目的
に合った尤度の高いキーワードの抽出が可能となる。
【0027】パラメータ最適化手法としては、上記した
遺伝的アルゴリズムに限らず、全探索やニューラルネッ
トワークなど評価値を最大化することでパラメータの探
索が出来るアルゴリズムであれば、パラメータ最適化部
41において同様に使用できる。全探索を使う場合は、
パラメータの全ての組合せを作成し、それらの評価値で
最大のものを最適なパラメータとして選択する。
【0028】なお、本発明の各手段は、コンピュータを
用いてソフトウェア的に実現し、あるいはそれら各機能
を有する専用のハード回路を用いて実現する事が出来
る。
【0029】
【発明の効果】以上述べたところから明らかなように、
本発明は、キーワード抽出パラメータのちがいにより様
々なキーワードを抽出することのできるキーワード抽出
手段により、目的に合わせた汎用性の高いキーワード抽
出が可能となる。
【0030】また、自動抽出されたキーワードの尤度を
数値化するキーワード評価手段により効率的なキーワー
ドの校正および客観的評価が可能となる。
【0031】また、パラメータ最適化手段によりキーワ
ード評価値を最大化するようなパラメータを効率的に探
索することにより試行錯誤に依らないキーワード自動抽
出装置の性能向上が可能となる。
【図面の簡単な説明】
【図1】本発明の一実施例を示すブロック図である。
【図2】同実施例のキーワード抽出手段の概要を示すブ
ロック図である。
【図3】同実施例のキーワード評価手段の概要を示すブ
ロック図である。
【図4】同実施例のパラメータ最適化手段の概要を示す
ブロック図である。
【図5】同実施例のルール作成支援部とルール保存部を
説明するためのブロック図である。
【図6】同実施例の教師入力部の処理を説明するための
ブロック図である。
【図7】従来のキーワード抽出装置の構成を示すブロッ
ク図である。
【図8】従来のキーワード抽出装置の動作を示すブロッ
ク図である。
【符号の説明】
1 入力文書 2 文字列 3 キーワード抽出手段 4 キーワード候補 5 キーワード評価手段 6 キーワード評価値 7 パラメータ最適化手段 8 キーワード抽出パラメータ 9 文字列 10 キーワード
───────────────────────────────────────────────────── フロントページの続き (72)発明者 〆木 泰治 大阪府門真市大字門真1006番地 松下電器 産業株式会社内 (72)発明者 前川 英嗣 大阪府門真市大字門真1006番地 松下電器 産業株式会社内

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】キーワード抽出パラメータに従って、入力
    文書よりキーワードを抽出するキーワード抽出手段と、
    前記キーワード抽出手段が抽出したキーワードの尤度を
    演算しキーワード評価値として出力するキーワード評価
    手段と、キーワード評価値を最大化するように、前記キ
    ーワード抽出パラメータを修正するパラメータ最適化手
    段とを備えたことを特徴とするキーワード自動抽出装
    置。
  2. 【請求項2】キーワード抽出手段は、前記入力文書中の
    単語の品詞や頻度や文法的関係等を解析する形態素解析
    部と、その形態素解析結果を元にキーワードを作成する
    キーワード候補作成部と、前記キーワード抽出パラメー
    タに従って、前記形態素解析部とキーワード候補作成部
    の動作を決定するキーワード抽出パラメータ制御部と、 を備えたことを特徴とする請求項1記載のキーワード自
    動抽出装置。
  3. 【請求項3】キーワード評価手段は、使用者によるキー
    ワード評価を入力する教師入力部と、前記キーワード抽
    出手段が出力するキーワード候補の情報と前記教師入力
    部からの情報によりキーワードを決定し出力するキーワ
    ード決定部と、そのキーワードの決定結果よりキーワー
    ド評価値を演算する評価値演算部と、 を備えたことを特徴とする請求項1記載のキーワード自
    動抽出装置。
  4. 【請求項4】パラメータ最適化手段は、前記キーワード
    評価手段が出力するキーワード評価値を最大化するよう
    に、前記キーワード抽出パラメータを設定して、前記キ
    ーワード抽出手段に出力するパラメータ最適化部を持つ
    ことを特徴とする請求項1記載のキーワード自動抽出装
    置。
  5. 【請求項5】キーワード抽出手段は、様々なキーワード
    抽出ルールを記録している抽出ルール記録部と、前記パ
    ラメータ制御部からの問い合わせに応じてキーワード抽
    出ルールを選択する抽出ルール選択部とからなるルール
    保存部を持つことを特徴とする請求項2記載のキーワー
    ド自動抽出装置。
  6. 【請求項6】キーワード抽出手段は、そのキーワード抽
    出手段により抽出されたキーワードと抽出に用いたルー
    ルとの相関関係を使用者に示すルール表示部と、新規の
    抽出ルールを入力するルール入力部で構成されるルール
    作成支援部とを持つことを特徴とする請求項2記載のキ
    ーワード自動抽出装置。
  7. 【請求項7】キーワード評価手段は、前記キーワード抽
    出手段より得られる入力文書の形態素解析結果とキーワ
    ード候補を共に表示し、相関関係を示すことで、前記教
    師入力部を介しての使用者のキーワード評価を支援する
    情報表示部を持つことを特徴とする請求項3記載のキー
    ワード自動抽出装置。
  8. 【請求項8】キーワード評価手段の教師入力部は、入力
    文書より使用者が抽出したキーワード文字列を入力する
    キーワード入力部と、前記キーワード抽出手段の出力す
    るキーワード候補文字列と使用者の抽出するキーワード
    文字列の比較評価部とを持つことを特徴とする請求項3
    記載のキーワード自動抽出装置。
  9. 【請求項9】キーワード評価手段の教師入力部は、前記
    キーワード抽出手段の出力したキーワード候補を使用者
    が目的に応じて尤度順に並べ変えることによってキーワ
    ード評価を行うキーワード順序評価部を持つことを特徴
    とする請求項3記載のキーワード自動抽出装置。
  10. 【請求項10】キーワード評価手段の教師入力部は、前
    記キーワード抽出手段が出力したキーワード候補を使用
    者が修正、削除、追加などの校正をすることによりキー
    ワード評価を行うキーワード校正部を持つことを特徴と
    する請求項3記載のキーワード自動抽出装置。
  11. 【請求項11】キーワード評価手段の教師入力部は、そ
    の教師入力部において使用者が評価した尺度を目的別に
    保存する評価尺度保存部と、目的に応じてそれらを選択
    し利用する評価尺度選択部を持つことを特徴とする請求
    項3記載のキーワード自動抽出装置。
  12. 【請求項12】パラメータ最適化手段は、最適化された
    パラメータを目的別に記録するパラメータ保存部と、目
    的に応じそれらを呼び出して利用する初期値設定部を持
    つことを特徴とする請求項4記載のキーワード自動抽出
    装置。
JP5216784A 1993-08-31 1993-08-31 キーワード自動抽出装置 Pending JPH0765018A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5216784A JPH0765018A (ja) 1993-08-31 1993-08-31 キーワード自動抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5216784A JPH0765018A (ja) 1993-08-31 1993-08-31 キーワード自動抽出装置

Publications (1)

Publication Number Publication Date
JPH0765018A true JPH0765018A (ja) 1995-03-10

Family

ID=16693840

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5216784A Pending JPH0765018A (ja) 1993-08-31 1993-08-31 キーワード自動抽出装置

Country Status (1)

Country Link
JP (1) JPH0765018A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013544397A (ja) * 2010-11-05 2013-12-12 楽天株式会社 キーワード抽出に関するシステム及び方法
JP2016062275A (ja) * 2014-09-17 2016-04-25 ヤフー株式会社 抽出装置、抽出方法および抽出プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013544397A (ja) * 2010-11-05 2013-12-12 楽天株式会社 キーワード抽出に関するシステム及び方法
JP2016062275A (ja) * 2014-09-17 2016-04-25 ヤフー株式会社 抽出装置、抽出方法および抽出プログラム

Similar Documents

Publication Publication Date Title
US5257186A (en) Digital computing apparatus for preparing document text
US7809744B2 (en) Method and system for approximate string matching
JP3689455B2 (ja) 情報処理方法及び装置
US6687697B2 (en) System and method for improved string matching under noisy channel conditions
JPH08305730A (ja) 機械読み取り可能形式の文書からプロセッサに対してキーフレーズを選択する自動的方法
JPH06266780A (ja) 意味パターン認識による文字列検索方法及びその装置
JP2002215619A (ja) 翻訳文書からの翻訳文抽出方法
JP2001215986A (ja) パターンマッチング方法及び装置
JP2000200281A (ja) 情報検索装置および情報検索方法ならびに情報検索プログラムを記録した記録媒体
JP2001318792A (ja) 固有表現抽出規則生成システムと方法およびその処理プログラムを記録した記録媒体ならびに固有表現抽出装置
JP2001175661A (ja) 全文検索装置及び全文検索方法
JPH09282331A (ja) 文書類似判定装置および文書類似判定方法
JPH0765018A (ja) キーワード自動抽出装置
US6757647B1 (en) Method for encoding regular expressions in a lexigon
US20040054677A1 (en) Method for processing text in a computer and a computer
JPH06274546A (ja) 情報量一致度計算方式
JP2002259912A (ja) オンライン文字列認識装置及びオンライン文字列認識方法
JP2000276482A (ja) 文書検索装置及び文書検索方法
JPH0652151A (ja) 共起学習装置及びこれを用いたかな漢字変換装置
JPH0757059A (ja) 文字認識装置
JP3339879B2 (ja) 文字認識装置
JP3241854B2 (ja) 単語スペル自動補正装置
JPH03268064A (ja) データ検索装置及びデータ検索方法
JPH1091493A (ja) データベースの構築方法
JP3123181B2 (ja) 文字認識装置