JPH07262200A - 文分類装置 - Google Patents

文分類装置

Info

Publication number
JPH07262200A
JPH07262200A JP6048457A JP4845794A JPH07262200A JP H07262200 A JPH07262200 A JP H07262200A JP 6048457 A JP6048457 A JP 6048457A JP 4845794 A JP4845794 A JP 4845794A JP H07262200 A JPH07262200 A JP H07262200A
Authority
JP
Japan
Prior art keywords
keyword
classification
keywords
classification number
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6048457A
Other languages
English (en)
Inventor
Tamotsu Mizuguchi
有 水口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP6048457A priority Critical patent/JPH07262200A/ja
Publication of JPH07262200A publication Critical patent/JPH07262200A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【目的】 本発明は、入力文を分類する文分類装置に関
し、分類番号に対応づけて1つあるいは複数のキーワー
ド、および優先分類順を予め登録したキーワードテーブ
ルを準備し、これらを順次探索して一致したキーワード
の分類番号に分類し、1つあるいは複数のキーワードの
組み合わせで分類してキーワード数を減らして細かい分
類を実現したり、更に優先分類順を設定して優先的に所
望の分類先への分類を実現したりすることを目的とす
る。 【構成】 分類番号に対応づけてキーワードを登録した
キーワードテーブル4と、入力された文字列について、
キーワードテーブル4のキーワードと一部あるいは全部
が一致したときの分類番号を取り出すキーワードマッチ
ング手段3とを備え、入力された文字列をこの取り出し
た分類番号に分類するように構成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力文を分類する文分
類装置に関するものである。
【0002】
【従来の技術】従来、ニュースの分類・保存・データベ
ース化などのときに、キーワード文字列のマッチング方
法が使われていた。このキーワード文字列のマッチング
方法によって、例えば「自動車」というようにキーワー
ド分類していた。
【0003】
【発明が解決しようとする課題】従来は上述したように
単純な単語、例えば上述した「自動車」をキーワード文
字列として抽出していた。このため、「早い自動車」と
「遅い自動車」や、「早い自動車」と「早くない自動
車」などの反対の意味を持つ日本語文の分類を行うこと
ができない問題があった。
【0004】また、従来は、例えば「早い自動車」、
「早く走る自動車」、「早く走っている自動車」とを同
じ「早い自動車」に分類するには、それぞれをキーワー
ド文字列として持っていなければならないという問題も
あった。
【0005】本発明は、これらの問題を解決するため、
分類番号に対応づけて1つあるいは複数のキーワード、
および優先分類順を予め登録したキーワードテーブルを
準備し、これらを順次探索して一致したキーワードの分
類番号に分類し、1つあるいは複数のキーワードの組み
合わせで分類してキーワード数を減らして細かい分類を
実現したり、更に優先分類順を設定して優先的に所望の
分類先への分類を実現したりすることを目的としてい
る。
【0006】
【課題を解決するための手段】図1は、本発明の原理ブ
ロック図を示す。図1において、入力装置1は、分類し
ようとする文字列を入力するものである。
【0007】入力文字管理手段2は、入力装置1から入
力された文字を管理するものである。キーワードマッチ
ング手段3は、入力された文字列についてキーワードテ
ーブル4のキーワードと一部あるいは全部が一致したと
きのその分類番号を取り出したりなどするものである。
【0008】キーワードテーブル4は、分類番号に対応
づけてキーワード、優先分類順を予め登録したものであ
る。分類結果格納手段5は、キーワードマッチング手段
3によって分類された分類番号を入力された文字列に対
応づけて、文格納テーブル6に格納するものである。
【0009】文格納テーブル6は、分類結果を入力され
た文字列に対応づけて格納するものである。
【0010】
【作用】本発明は、図1に示すように、入力装置1から
分類しようとする文字列が入力されたことに対応して、
キーワードマッチング手段3が入力された文字列につい
て、キーワードテーブル4のキーワードと一部あるいは
全部が一致したときの分類番号を取り出し、入力された
文字列をこの取り出した分類番号に分類するようにして
いる。
【0011】また、キーワードマッチング手段3が入力
された文字列について、キーワードテーブル4の複数の
キーワードの全てと一部あるいは全部が一致したときの
分類番号を取り出し、入力された文字列をこの取り出し
た分類番号に分類するようにしている。
【0012】また、キーワードマッチング手段3が入力
された文字列について、キーワードテーブル4の1つの
キーワードと一部あるいは全部が一致したときの優先分
類順に設定されている分類番号のキーワードと一部ある
いは全部が一致したときに当該分類番号を取り出し、一
方、一致しなかったときに1つのキーワードと一致した
分類番号を取り出し、入力された文字列をこの取り出し
た分類番号に分類するようにしている。
【0013】また、キーワードマッチング手段3が入力
された文字文について、キーワードテーブル4の複数の
キーワードと一部あるいは全部が一致したときの優先分
類順に設定されている分類番号のキーワードと一部ある
いは全部が一致したときに当該分類番号を取り出し、一
方、一致しなかったときに複数のキーワードと一致した
分類番号を取り出し、入力された文字列をこの取り出し
た分類番号に分類するようにしている。
【0014】これらの際に、キーワードマッチング手段
3が入力された文字列について、1つあるいは複数のキ
ーワードと一部あるいは全部が一致したときに、一致し
たキーワードの数が多い方、キーワードの数が同一のと
きはキーワードの文字数の多い方、キーワードの文字数
が同一のときは最長のキーワードの方、最長のキーワー
ドが同一のときはキーワードの総文字数の多い方に分類
するようにしている。
【0015】また、キーワードとして、仮名、漢字、フ
ァルファベット、数字が混在する文字列とするようにし
ている。従って、分類番号に対応づけて1つあるいは複
数のキーワード、および優先分類順を予め登録したキー
ワードテーブル4を準備し、これらを順次探索して一致
したキーワードの分類番号に分類したり、更に分類優先
順に分類したりすることにより、1つあるいは複数のキ
ーワードの組み合わせで分類してキーワード数を減らし
て細かい分類を実現したり、更に優先分類順をキーワー
ドテーブル4に設定して関連する優先するキーワードか
ら先にマッチしてより望ましい分類を行ったりすること
が可能となる。
【0016】
【実施例】次に、図2から図14を用いて本発明の実施
例の構成および動作を順次詳細に説明する。
【0017】図2のフローチャート(その1)に示す順
序に従い、図3のキーワードテーブル4(その1)を使
用したときの図1の構成の動作を詳細に説明する。図2
において、S1は、ユーザに対する入力要求する。
【0018】S2は、S1の入力要求に対応して、ユー
ザが分類対象の文(文字列、入力文)を入力する。例え
ば右側に記載した下記の 「この問題は遺伝的アルゴリズム手法で解いた」 を入力する。
【0019】S3は、終わりか判別する。YESの場合
には、終了する(END)。NOの場合には、S4に進
む。S4は、入力文と、図3の(a)あるいは(b)の
キーワードテーブル4とのマッチングを行う。
【0020】S5は、見つかったか判別する。これは、
S4のマッチングにより、入力文の一部あるいは全部が
図3の(a)あるいは(b)のキーワードテーブル4の
いずれかのキーワードとマッチング(一致)するものが
見つかったか判別する。YESの場合には、S6でキー
ワードテーブル4からマッチングした分類番号を取り出
して入力文に付加し、S7で結果表示として、分類番
号、キーワード、入力文を関連づけて表示する。一方、
NOの場合には、S3に戻る。例えば上述した入力文
「この問題は遺伝的アルゴリズム手法で解いた」の場
合、図3の(a)のキーワードテーブル4とマッチング
を行い、ここでは、キーワード「遺伝的アルゴリズム」
とマッチング(一致)するので、このときの分類番号3
0が得られるので、結果表示として、 ・分類番号:30 ・キーワード:「遺伝的アルゴリズム」 ・入力文:「この問題は遺伝的アルゴリズム手法で解い
た」 を表示する。
【0021】以上によって、ユーザが文を入力して分類
を指示したことに対応して、入力文と図3の(a)ある
いは(b)のキーワードテーブル4と一部あるいは全部
が一致するかのマッチングを行い、一部あるいは全部が
一致する分類番号を取り出し、この分類番号を入力文に
付加して保存すると共に、分類番号、キーワード、入力
文を対応づけて表示する。これらにより、キーワードテ
ーブル4に予め登録した漢字、かな、カタカナ、アルフ
ァベット、数字などにどのような文字列であっても、分
類してその分類番号を決定することが可能となる。
【0022】図3は、本発明のキーワードテーブル例
(その1)を示す。これは、図2のフローチャートに使
用するキーワードテーブル4の例である。図3の(a)
は、キーワードテーブル例を示す。この図示のキーワー
ドテーブル4は、分類番号に対応づけてキーワードを予
め登録したものであって、ここでは、漢字、ひらがな、
数字、アルファベットから構成されるものである。
【0023】図3の(b)は、キーワードテーブル例を
示す。この図示のキーワードテーブル4は、分類番号に
対応づけてキーワードを予め登録したものであって、こ
こでは、漢字、ひらがな、数字、アルファベット、記号
などから構成されるものである。
【0024】図4は、本発明の文格納テーブル例を示
す。この文格納テーブル6は、キーワードマッチング手
段3が入力文を図3の(a)あるいは(b)のキーワー
ドテーブル4のキーワードとマッチングを行い、一致し
た部分(下線部分)に分類番号を付与したものを模式的
に表したものである。このように、文字列を入力する
と、キーワードテーブル4に予め設定されているキーワ
ードと一致したときの一致部分とその分類番号を対応づ
けて表示することにより、入力文の分類を自動的に行う
ことが可能となる。
【0025】次に、図5のフローチャート(その2)に
示す順序に従い、図6のキーワードテーブル4(その
2)を使用したときの図1の構成の動作を詳細に説明す
る。図5において、S11は、ユーザに対する入力要求
する。
【0026】S12は、S11の入力要求に対応して、
ユーザが分類対象の文を入力する。例えば右側に記載し
た下記の 「早い自動車」 を入力する。
【0027】S13は、終わりか判別する。YESの場
合には、終了する(END)。NOの場合には、S14
に進む。S14は、入力文に全てのキーワードが含まれ
るかを、図6のキーワードテーブル4とのマッチングを
行う。これは、キーワードテーブル4の分類番号に対応
づけて複数のキーワードが予め登録されているので、こ
こでは全てのキーワードが当該入力文に含まれるか(論
理積の場合)のマッチングを行う。この他に、論理和の
場合には、いずれかのキーワードに一致したときにその
分類番号を取り出す。ここでは、以下論理積の場合に限
って説明する。
【0028】S15は、見つかったか判別する。これ
は、S14のマッチングにより、入力文中で図6のキー
ワードテーブル4の全てのキーワードと一致するものが
見つかったか判別する。YESの場合には、S16でキ
ーワードテーブル4から一致した分類番号を取り出して
入力文に付加し、S7で結果表示として、分類番号、キ
ーワード、入力文を関連づけて表示する。一方、NOの
場合には、S13に戻る。例えば上述した入力文「早い
自動車」の場合、図6のキーワードテーブル4とマッチ
ングを行い、ここでは、キーワード1「早」、キーワー
ド2「自動車」と一致するので、このときの分類番号1
0が得られるので、結果表示として、 ・分類番号:10 ・キーワード1:「早い」、キーワード2:「自動車」 ・入力文:「早い自動車」 を表示する。
【0029】以上によって、ユーザが文を入力して分類
を指示したことに対応して、入力文中で図6のキーワー
ドテーブル4の複数のキーワードと、ここでは全部一致
するかマッチングを行い、全部が一致する分類番号を取
り出し、この分類番号を入力文に付加して保存すると共
に、分類番号、キーワード、入力文を対応づけて表示す
る。これらにより、キーワードテーブル4に予め登録し
た漢字、かな、カタカナ、アルファベット、数字などか
なる複数のキーワードの論理積を満足した場合(他に論
理和を満足した場合もある)に、分類してその分類番号
を決定することが可能となる。
【0030】図6は、本発明のキーワードテーブル例
(その2)を示す。これは、図5のフローチャートに使
用するキーワードテーブル4の例であって、分類番号に
対応づけて複数のキーワードを登録し、ここでは、全部
のキーワードが入力文中に含まれていたときに一致する
としたものである。
【0031】次に、図7のフローチャート(その3)に
示す順序に従い、図8のキーワードテーブル4(その
3)を使用したときの図1の構成の動作を詳細に説明す
る。図7において、S21は、ユーザに対する入力要求
する。
【0032】S22は、S21の入力要求に対応して、
ユーザが分類対象の文を入力する。例えば右側に記載し
た下記の 「男性」 を入力する。
【0033】S23は、終わりか判別する。YESの場
合には、終了する(END)。NOの場合には、S24
に進む。S24は、入力文中にキーワードが含まれるか
を、図8のキーワードテーブル4とのマッチングを行
う。これは、キーワードテーブル4の分類番号に対応づ
けてキーワードが予め登録されているので、このキーワ
ードが当該入力文に含まれるかのマッチングを行う。
【0034】S25は、見つかったか判別する。これ
は、S24のマッチングにより、入力文中で図8のキー
ワードテーブル4のキーワードと一致するものが見つか
ったか判別する。YESの場合には、S26に進む。N
Oの場合にはS23に戻る。
【0035】S26は、キーワードテーブル4の一致し
たキーワードに優先分類順が設定されているか判別す
る。YESの場合には、S27に進む。NOの場合に
は、優先分類順が設定されていなかったので、S30で
一致したキーワードの分類番号に決定し、S31に進
む。
【0036】S27は、優先分類順が終わりか判別す
る。YESの場合には、優先分類順が設定されていなか
ったので、S30で一致したキーワードの分類番号に決
定し、S31に進む。一方、NOの場合には、S28に
進む。
【0037】S28は、優先分類順に設定されている分
類番号を取り出し、この取り出した分類番号(優先分類
番号)のキーワードが入力文中にあるかマッチングす
る。YESの場合には、優先分類順の分類番号のキーワ
ードと一致したので、S29で一致した分類番号に決定
し、S31に進む。一方、NOの場合には、S27に戻
る。
【0038】S31は、キーワードテーブル4から分類
番号を取り出して入力文に付加する。例えば右側に記載
したように「分類番号:1100」を入力文「男性」に
付加する。
【0039】S32は、結果表示する。例えば上述した
入力文「男性」の場合、図8ののキーワードテーブル4
とマッチングを行い、ここでは、分類番号1000のキ
ーワド「男」と一致したので、優先分類順「120
0」、「1100」を順次取り出して、その分類番号の
キーワード「男性」、「男女」と入力文とをマッチング
し、ここでは、キーワード「男性」と一致したので、分
類番号1100と決定し、結果を ・分類番号:1100 ・キーワード:「男性」 ・入力文:「男性」 と表示する。
【0040】以上によって、ユーザが文を入力して分類
を指示したことに対応して、入力文中で図8のキーワー
ドテーブル4のキーワードと一致するかマッチングを行
い、一致したキーワードの分類優先順の分類番号のキー
ワードと優先的にマッチングを行い、一致したときの分
類番号を優先的に入力文に対応づけて表示する。これら
により、キーワードテーブル4に予めキーワードおよび
分類優先順の分類番号を設定しておくことにより、入力
文に含まれる文字について優先順に分類番号を決定する
ことが可能となる。
【0041】図8、本発明のキーワードテーブル例(そ
の3)を示す。これは、図7のフローチャートに使用す
るキーワードテーブル4の例であって、分類番号に対応
づけてキーワードおよび分類優先順を登録し、入力文が
キーワードに一致したときに優先して分類を行う分類番
号(キーワード)を任意に指定することが可能となる。
【0042】次に、図9のフローチャート(その4)に
示す順序に従い、図10のキーワードテーブル4(その
4)を使用したときの図1の構成の動作を詳細に説明す
る。図9において、S41は、ユーザに対する入力要求
する。
【0043】S42は、S41の入力要求に対応して、
ユーザが分類対象の文を入力する。例えば右側に記載し
た下記の 「サッカーボール」 を入力する。
【0044】S43は、入力文とキーワードテーブル4
とのマッチングを終わりまで行う。これは、図10のキ
ーワードテーブル4の分類番号に対応づけてキーワード
が予め登録されているので、このキーワードが当該入力
文に含まれるかのマッチングを終わりまで行う。
【0045】S44は、見つかったか判別する。これ
は、S43のマッチングにより、入力文中で図10のキ
ーワードテーブル4のキーワードと一致するものが見つ
かったか判別する。YESの場合には、S45に進む。
NOの場合には終了する(END)。
【0046】S45は、マッチングしたのが1つか判別
する。YESの場合には、S46でその分類番号に決定
し、S48に進む。一方、NOの場合には、複数のキー
ワードが一致したので、S47でキーワードの文字数の
一番長い分類番号に決定し、S48に進む。
【0047】S48は、キーワード4から分類番号を取
り出して入力文に付加する。例えば右側に記載したよう
に「分類番号:100」を入力文「サッカボール」に付
加する。
【0048】S49は、結果表示する。例えば上述した
入力文「サッカボール」の場合、図10ののキーワード
テーブル4とマッチングを行い、ここでは、分類番号4
0のキーワード「サッカー」および分類番号100のキ
ーワード「サッカーボール」の2つに一致したが、キー
ワードの文字数が長い「サッカーボール」の分類番号と
決定し、結果を ・分類番号:100 ・キーワード:「サッカーボール」 ・入力文:「サッカーボール」 と表示する。
【0049】以上によって、ユーザが文を入力して分類
を指示したことに対応して、入力文中で図10のキーワ
ードテーブル4のキーワードと一致するものが含まれる
かのマッチングを全て行い、一致したキーワードのうち
の一番長いキーワードの分類番号と決定して入力文に対
応づけて表示する。これらにより、キーワードテーブル
4に予めキーワードの付加される文字列によって異なる
ものとして分類される文字列についてそれぞれのキーワ
ードを登録して一番長いキーワードの分類番号に分類す
ることが可能となる。
【0050】図10、本発明のキーワードテーブル例
(その4)を示す。これは、図9のフローチャートで使
用するキーワードテーブル4の例であって、分類番号に
対応づけてキーワードを登録し、入力文がキーワードに
一致したのを全て取り出し、そのうちから一番キーワー
ドの長いものの分類番号に分類することが可能となる。
例えば図示の 分類番号 キーワード 40 サッカー 100 サッカーボール というように登録しておき、入力文の一部がこれらキー
ワードに一致したときに、一致したキーワードの最も長
いものの分類番号と決定する。
【0051】次に、図11のフローチャート(その5)
に示す順序に従い、図12のキーワードテーブル4(そ
の5)を使用したときの図1の構成の動作を詳細に説明
する。
【0052】図11において、S51は、ユーザに対す
る入力要求する。S52は、S51の入力要求に対応し
て、ユーザが分類対象の文を入力する。例えば右側に記
載した下記の 「傷付く」 を入力する。
【0053】S53は、終わりか判別する。YESの場
合には、キーワードテーブル4の全てのキーワードとの
マッチングを終わったので、終了する(END)。一
方、NOの場合には、S54に進む。
【0054】S54は、入力文に全てのキーワードが含
まれるかのマッチングを行う。これは、例えば図12の
キーワードテーブル4中のキーワードの全てが入力文に
含まれるものがあるかのマッチングを行う。ここでは、
入力文「傷付く」は、分類番号2000に、キーワード
「傷」とキーワード「付く」の2つがあって全てが入力
文に含まれると判明する。
【0055】S55は、マッチして全て一致したものが
見つかったか判別する。YESの場合には、S56に進
む。NOの場合には、S53に戻る。S56は、キーワ
ードテーブル4の一致したキーワードに優先分類順が設
定されているか判別する。YESの場合には、S57に
進む。NOの場合には、優先分類順が設定されていなか
ったので、S60で一致したキーワードの分類番号に決
定し、S61に進む。
【0056】S57は、優先分類順が終わりか判別す
る。YESの場合には、優先分類順が設定されていなか
ったので、S60でマッチングしたキーワードの分類番
号に決定し、S61に進む。一方、NOの場合には、S
58に進む。
【0057】S58は、優先分類順に設定されている分
類番号を取り出し、この取り出した分類番号(優先分類
番号)のキーワードが入力文中にあるかマッチングす
る。YESの場合には、優先分類順の分類番号のキーワ
ードと一致したので、S59で一致した分類番号に決定
し、S61に進む。一方、NOの場合には、S57に戻
る。
【0058】S61は、キーワードテーブル4から分類
番号を取り出して入力文に付加する。例えば右側に記載
したように「分類番号:2000」を入力文「傷付く」
に付加する。
【0059】S62は、結果表示する。例えば上述した
入力文「傷付く」の場合、図12のキーワードテーブル
4とマッチングを行い、ここでは、分類番号2000の
キーワード「傷付く」と一致したので、優先分類順「2
100」、「2200」を順次取り出して、その分類番
号のキーワード「傷」、「付きやすい」と、キーワード
「傷」、「付きにくい」と入力文とをマッチングし、こ
こでは、分類番号2100、2200が一致しなかった
ので、分類番号2000と決定し、結果を ・分類番号:2000 ・キーワード:「傷」、「付」 ・入力文:「傷付く」 と表示する。
【0060】以上によって、ユーザが文を入力して分類
を指示したことに対応して、入力文中で図11のキーワ
ードテーブル4のキーワードと一致するかマッチングを
行い、一致したキーワードの分類優先順の分類番号のキ
ーワードと優先的にマッチングを行い、一致したときの
分類番号を優先的に入力文に対応づけて表示し、一方、
一致しないときは元の一致した分類番号を入力文に対応
づけて表示する。これらにより、キーワードテーブル4
に予めキーワードおよび分類優先順の分類番号を設定し
ておくことにより、入力文に含まれる文字について優先
順に分類番号を決定することが可能となる。
【0061】図12は、本発明のキーワードテーブル例
(その5)を示す。これは、図11のフローチャートに
使用するキーワードテーブル4の例であって、分類番号
に対応づけてキーワードおよび分類優先順を登録し、入
力文がキーワードに一致したときに、優先して分類を行
う分類番号(キーワード)を任意に指定することが可能
となる。
【0062】次に、図13のフローチャート(その6)
に示す順序に従い、図14のキーワードテーブル4(そ
の6)を使用したときの図1の構成の動作を詳細に説明
する。
【0063】図13において、S71は、ユーザに対す
る入力要求する。S72は、S71の入力要求に対応し
て、ユーザが分類対象の文を入力する。例えば右側に記
載した下記の 「男女兼用」 を入力する。
【0064】S73は、入力文の全てのキーワードが含
まれるかのマッチングをキーワードテーブルの最後まで
行う。これは、例えば図14のキーワードテーブル4の
分類番号に対応づけて予め登録されているキーワード
1、2、3などの全てが入力文に含まれるかのマッチン
グを、当該キーワードテーブル4の最後まで行う。
【0065】S74は、入力文に全てのキーワードを含
むものがマッチングして見つかったか判別する。YES
の場合には、キーワードテーブル4の全てのキーワード
とのマッチングを終わったので、終了する(END)。
一方、NOの場合には、S75に進む。
【0066】S75は、見つかったのが1つか判別す
る。YESの場合には、S76でその分類番号に決定
し、S78に進む。一方、NOの場合には、複数の一致
する分類番号のものが見つかったので、S77でキーワ
ード数の一番多い分類番号に決定し、S78に進む。
【0067】S78は、キーワードテーブル4から分類
番号を取り出して入力文に付加する。例えば右側に記載
したように「分類番号:3000」を入力文「男女兼
用」に付加する。
【0068】S79は、結果表示する。例えば上述した
入力文「男女兼用」の場合、図14のキーワードテーブ
ル4とマッチングを行い、ここでは、分類番号200の
キーワード1「男」、キーワード2「女」、および分類
番号3000のキーワード1「男」、キーワード2
「女」、キーワード3「兼用」の2つに一致したので、
キーワード数の一番多い分類番号3000と決定し、結
果を ・分類番号:3000 ・キーワード:「男」、「女」、「兼用」 ・入力文:「男女兼用」 と表示する。
【0069】以上によって、ユーザが文を入力して分類
を指示したことに対応して、入力文中で図14のキーワ
ードテーブル4の複数のキーワードと一致するかマッチ
ングを行い、一致した分類番号が複数あるときは一致し
た分類番号のキーワード文字数の多い方の分類番号と決
定し、決定した分類番号およびキーワードに対応づけて
入力文を表示する。これらにより、キーワードテーブル
4に予め複数のキーワードを設定しておくことにより、
入力文に含まれる複数に分割しうる文字列について個々
および全体の文字列の任意の組み合わせについても分類
番号を決定することが可能となる。
【0070】図13は、本発明のキーワードテーブル例
(その6)を示す。これは、図13のフローチャートで
使用するキーワードテーブル4の例であって、分類番号
に対応づけて複数のキーワードを登録し、入力文が複数
のキーワードに一致したときにキーワード数の一番長い
ものの分類番号に分類することが可能となる。
【0071】
【発明の効果】以上説明したように、本発明によれば、
分類番号に対応づけて1つあるいは複数のキーワード、
および優先分類順を予め登録したキーワードテーブル4
を準備し、これらを順次探索して一致したキーワードの
分類番号に分類する構成を採用しているため、1つある
いは複数のキーワードの組み合わせで分類してキーワー
ド数を減らして細かい分類を実現したり、更に優先分類
順をキーワードテーブル4に設定して関連する優先する
キーワードから先に一致させたより望ましい分類を行う
ことができる。これらにより、 (1) 例えば「早い AND 自動車」というキーワ
ードの組み合わせをキーワードテーブル4に登録してお
き、入力文として、 「早い自動車」 「早く走る自動車」 「早く走っている自動車」 を分類先の「早い自動車」にそれぞれ分類することが可
能となる。
【0072】(2) また、 「遅 AND 自動車」 「早 AND ない AND 自動車」 という2つあるいは3つのキーワードの組み合わせをキ
ーワードテーブル4に登録しておき、両者に関連する入
力文について、いずれも「遅い自動車」に分類すること
ができる。これらにより、キーワード数を減らしても細
かな分類を行うことが可能となった。
【図面の簡単な説明】
【図1】本発明の原理ブロック図である。
【図2】本発明の動作説明フローチャート(その1)で
ある。
【図3】本発明のキーワードテーブル例(その1)であ
る。
【図4】本発明の文格納テーブル例である。
【図5】本発明の動作説明フローチャート(その2)で
ある。
【図6】本発明のキーワードテーブル例(その2)であ
る。
【図7】本発明の動作説明フローチャート(その3)で
ある。
【図8】本発明のキーワードテーブル例(その3)であ
る。
【図9】本発明の動作説明フローチャート(その4)で
ある。
【図10】本発明のキーワードテーブル例(その4)で
ある。
【図11】本発明の動作説明フローチャート(その5)
である。
【図12】本発明のキーワードテーブル例(その5)で
ある。
【図13】本発明の動作説明フローチャート(その6)
である。
【図14】本発明のキーワードテーブル例(その6)で
ある。
【符号の説明】
1:入力装置 2:入力文字管理手段 3:キーワードマッチング手段 4:キーワードテーブル 5:分類結果格納手段 6:文格納テーブル

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】分類番号に対応づけてキーワードを登録し
    たキーワードテーブル(4)と、 入力された文字列について、上記キーワードテーブル
    (4)のキーワードと一部あるいは全部が一致したとき
    の分類番号を取り出すキーワードマッチング手段(3)
    とを備え、 入力された文字列をこの取り出した分類番号に分類する
    ことを特徴とする文分類装置。
  2. 【請求項2】分類番号に対応づけて複数のキーワードを
    登録したキーワードテーブル(4)と、 入力された文字列について、上記キーワードテーブル
    (4)の複数のキーワードの全てと一部あるいは全部が
    一致したときの分類番号を取り出すキーワードマッチン
    グ手段(3)とを備え、 入力された文字列をこの取り出した分類番号に分類する
    ことを特徴とする文分類装置。
  3. 【請求項3】分類番号に対応づけて1つのキーワードお
    よび優先分類順を登録したキーワードテーブル(4)
    と、 入力された文字列について、上記キーワードテーブル
    (4)の1つのキーワードと一部あるいは全部が一致し
    たときの上記優先分類順に設定されている分類番号のキ
    ーワードと一部あるいは全部が一致したときに当該分類
    番号を取り出し、一方、一致しなかったときに1つのキ
    ーワードと一致した分類番号を取り出すキーワードマッ
    チング手段(3)とを備え、 入力された文字列をこの取り出した分類番号に分類する
    ことを特徴とする文分類装置。
  4. 【請求項4】分類番号に対応づけて複数のキーワードお
    よび優先分類順を登録したキーワードテーブル(4)
    と、 入力された文字文について、上記キーワードテーブル
    (4)の複数のキーワードと一部あるいは全部が一致し
    たときの上記優先分類順に設定されている分類番号のキ
    ーワードと一部あるいは全部が一致したときに当該分類
    番号を取り出し、一方、一致しなかったときに複数のキ
    ーワードと一致した分類番号を取り出すキーワードマッ
    チング手段(3)とを備え、 入力された文字列をこの取り出した分類番号に分類する
    ことを特徴とする文分類装置。
  5. 【請求項5】上記入力された文字列について、1つある
    いは複数のキーワードと一部あるいは全部が一致したと
    きに、一致したキーワードの数が多い方、キーワードの
    数が同一のときはキーワードの文字数の多い方、キーワ
    ードの文字数が同一のときは最長のキーワードの方、最
    長のキーワードが同一のときはキーワードの総文字数の
    多い方に分類することを特徴とする請求項1から請求項
    4に記載の文分類装置。
  6. 【請求項6】上記キーワードとして、仮名、漢字、ファ
    ルファベット、数字が混在する文字列としたことを特徴
    とする請求項1から請求項5に記載の文分類装置。
JP6048457A 1994-03-18 1994-03-18 文分類装置 Pending JPH07262200A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6048457A JPH07262200A (ja) 1994-03-18 1994-03-18 文分類装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6048457A JPH07262200A (ja) 1994-03-18 1994-03-18 文分類装置

Related Child Applications (2)

Application Number Title Priority Date Filing Date
JP2002371834A Division JP3517665B2 (ja) 2002-12-24 2002-12-24 文分類装置
JP2003353595A Division JP3505565B2 (ja) 2003-10-14 2003-10-14 文分類装置

Publications (1)

Publication Number Publication Date
JPH07262200A true JPH07262200A (ja) 1995-10-13

Family

ID=12803894

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6048457A Pending JPH07262200A (ja) 1994-03-18 1994-03-18 文分類装置

Country Status (1)

Country Link
JP (1) JPH07262200A (ja)

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11328217A (ja) * 1998-05-11 1999-11-30 Toshio Yamazaki 情報収集検索装置
JPH11328223A (ja) * 1998-05-19 1999-11-30 Toshio Yamazaki 情報収集検索装置
JP2001034637A (ja) * 1999-07-27 2001-02-09 Zenrin Co Ltd 建物業態分類装置及び方法、建物業態別地図表示装置
JP2003529844A (ja) * 2000-03-31 2003-10-07 ユナイテッド ビデオ プロパティーズ, インコーポレイテッド メタデータによってリンクされた宣伝のシステムおよび方法
JP2005173977A (ja) * 2003-12-11 2005-06-30 Sony Corp アドレス記憶装置
US6985908B2 (en) 2001-11-01 2006-01-10 Matsushita Electric Industrial Co., Ltd. Text classification apparatus
JP2008310471A (ja) * 2007-06-13 2008-12-25 Toshiya Sehata 収斂型データベース構築システム及び構築方法
US8869204B2 (en) 1996-05-03 2014-10-21 Starsight Telecast, Inc. Method and system for displaying advertisements in an electronic program guide
US8918807B2 (en) 1997-07-21 2014-12-23 Gemstar Development Corporation System and method for modifying advertisement responsive to EPG information
US9015750B2 (en) 1998-05-15 2015-04-21 Rovi Guides, Inc. Interactive television program guide system for determining user values for demographic categories
US9075861B2 (en) 2006-03-06 2015-07-07 Veveo, Inc. Methods and systems for segmenting relative user preferences into fine-grain and coarse-grain collections
US9166714B2 (en) 2009-09-11 2015-10-20 Veveo, Inc. Method of and system for presenting enriched video viewing analytics
US9319735B2 (en) 1995-06-07 2016-04-19 Rovi Guides, Inc. Electronic television program guide schedule system and method with data feed access
US9326025B2 (en) 2007-03-09 2016-04-26 Rovi Technologies Corporation Media content search results ranked by popularity
US9426509B2 (en) 1998-08-21 2016-08-23 Rovi Guides, Inc. Client-server electronic program guide
US9736524B2 (en) 2011-01-06 2017-08-15 Veveo, Inc. Methods of and systems for content search based on environment sampling
US9749693B2 (en) 2006-03-24 2017-08-29 Rovi Guides, Inc. Interactive media guidance application with intelligent navigation and display features
JP2017187823A (ja) * 2016-04-01 2017-10-12 前田建設工業株式会社 文言追記装置、文言追記方法及び文言追記プログラム

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9319735B2 (en) 1995-06-07 2016-04-19 Rovi Guides, Inc. Electronic television program guide schedule system and method with data feed access
US8869204B2 (en) 1996-05-03 2014-10-21 Starsight Telecast, Inc. Method and system for displaying advertisements in an electronic program guide
US9015749B2 (en) 1997-07-21 2015-04-21 Rovi Guides, Inc. System and method for modifying advertisement responsive to EPG information
US9191722B2 (en) 1997-07-21 2015-11-17 Rovi Guides, Inc. System and method for modifying advertisement responsive to EPG information
US8918807B2 (en) 1997-07-21 2014-12-23 Gemstar Development Corporation System and method for modifying advertisement responsive to EPG information
JPH11328217A (ja) * 1998-05-11 1999-11-30 Toshio Yamazaki 情報収集検索装置
US9635406B2 (en) 1998-05-15 2017-04-25 Rovi Guides, Inc. Interactive television program guide system for determining user values for demographic categories
US9015750B2 (en) 1998-05-15 2015-04-21 Rovi Guides, Inc. Interactive television program guide system for determining user values for demographic categories
JPH11328223A (ja) * 1998-05-19 1999-11-30 Toshio Yamazaki 情報収集検索装置
US9426509B2 (en) 1998-08-21 2016-08-23 Rovi Guides, Inc. Client-server electronic program guide
JP2001034637A (ja) * 1999-07-27 2001-02-09 Zenrin Co Ltd 建物業態分類装置及び方法、建物業態別地図表示装置
US10015562B2 (en) 2000-03-31 2018-07-03 Rovi Guides, Inc. System and method for metadata-linked advertisements
US8863170B2 (en) 2000-03-31 2014-10-14 United Video Properties, Inc. System and method for metadata-linked advertisements
JP2003529844A (ja) * 2000-03-31 2003-10-07 ユナイテッド ビデオ プロパティーズ, インコーポレイテッド メタデータによってリンクされた宣伝のシステムおよび方法
US6985908B2 (en) 2001-11-01 2006-01-10 Matsushita Electric Industrial Co., Ltd. Text classification apparatus
JP2005173977A (ja) * 2003-12-11 2005-06-30 Sony Corp アドレス記憶装置
US9075861B2 (en) 2006-03-06 2015-07-07 Veveo, Inc. Methods and systems for segmenting relative user preferences into fine-grain and coarse-grain collections
US9092503B2 (en) 2006-03-06 2015-07-28 Veveo, Inc. Methods and systems for selecting and presenting content based on dynamically identifying microgenres associated with the content
US9128987B2 (en) 2006-03-06 2015-09-08 Veveo, Inc. Methods and systems for selecting and presenting content based on a comparison of preference signatures from multiple users
US10984037B2 (en) 2006-03-06 2021-04-20 Veveo, Inc. Methods and systems for selecting and presenting content on a first system based on user preferences learned on a second system
US9749693B2 (en) 2006-03-24 2017-08-29 Rovi Guides, Inc. Interactive media guidance application with intelligent navigation and display features
US9326025B2 (en) 2007-03-09 2016-04-26 Rovi Technologies Corporation Media content search results ranked by popularity
US10694256B2 (en) 2007-03-09 2020-06-23 Rovi Technologies Corporation Media content search results ranked by popularity
JP2008310471A (ja) * 2007-06-13 2008-12-25 Toshiya Sehata 収斂型データベース構築システム及び構築方法
US9166714B2 (en) 2009-09-11 2015-10-20 Veveo, Inc. Method of and system for presenting enriched video viewing analytics
US9736524B2 (en) 2011-01-06 2017-08-15 Veveo, Inc. Methods of and systems for content search based on environment sampling
JP2017187823A (ja) * 2016-04-01 2017-10-12 前田建設工業株式会社 文言追記装置、文言追記方法及び文言追記プログラム

Similar Documents

Publication Publication Date Title
JPH07262200A (ja) 文分類装置
CN106528599B (zh) 一种海量音频数据中的字符串快速模糊匹配算法
US5544049A (en) Method for performing a search of a plurality of documents for similarity to a plurality of query words
US7257530B2 (en) Method and system of knowledge based search engine using text mining
US6993517B2 (en) Information retrieval system for documents
US5523945A (en) Related information presentation method in document processing system
US5761666A (en) Document retrieval system
CN106557460A (zh) 从单文档中提取关键词的装置及方法
CN111611356A (zh) 信息查找方法、装置、电子设备及可读存储介质
JP2000357170A (ja) 文書の参照理由を用いて情報検索を行う装置
JPH07152771A (ja) 利用者情報管理装置、情報フィルタ、情報分類装置、情報再生装置、情報検索装置及び仮名漢字変換装置
JP2005038395A (ja) データベース検索装置
JP3385297B2 (ja) 文書の自動分類方法、および情報空間の可視化方法、ならびに情報検索システム
CN110209765B (zh) 一种按语义搜索关键词的方法和装置
JP2000331012A (ja) 電子化文書検索方法
JP2000020538A (ja) 情報検索方法、情報検索装置および情報検索プログラム記憶媒体
JPH064584A (ja) 文章検索装置
JP3517665B2 (ja) 文分類装置
JPH09319767A (ja) 類義語辞書登録方法
CN118798183A (zh) 虚假新闻检测方法及装置
JP3505565B2 (ja) 文分類装置
JPH10289246A (ja) 類似文書検索装置及び類似文書検索方法
JPH10232871A (ja) 検索装置
JPH09185632A (ja) 情報検索・編集方法及び装置
JP2000200279A (ja) 情報検索装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040406