JPH1011434A

JPH1011434A - 情報認識装置

Info

Publication number: JPH1011434A
Application number: JP8181423A
Authority: JP
Inventors: Hideki Shimomura; 秀樹下村
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1996-06-21
Filing date: 1996-06-21
Publication date: 1998-01-16
Also published as: DE19726592A1; US5995664A; DE19726592C2

Abstract

(57)【要約】【課題】住所等を認識する情報認識装置に於いて、単
語区切り，要素指定のない形式で入力された認識対象情
報を、高速且つ精度良く認識する。【解決手段】要素単語認識手段１ａが、認識対象情報
の各要素の要素単語候補及び各要素単語候補の尤度を求
める。次いで、レコード番号獲得手段１ｄが、レコード
格納部１ｅを検索し、要素単語認識手段１ａで求められ
た各要素単語候補それぞれについてそれを含むレコード
のレコード番号を獲得する。その後、尤度計算手段１ｆ
が、上記各レコードの尤度を上記各レコード対応の尤度
カウンタを用いて求める。結果判定手段１ｈは、尤度カ
ウンタのカウント値に基づいて認識対象情報の認識結果
とすべきレコードを判定し、結果取り出し手段は、結果
判定手段の判定結果に基づいてレコード格納部から認識
結果とすべきレコードを取り出す。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、住所や顧客取引デ
ータ等のように複数の要素から構成され、且つ要素とな
り得る単語が各要素毎に所定個数定まっている情報を、
文字認識技術、或いは音声認識技術を利用して認識する
情報認識装置に関する。

【０００２】

【従来の技術】住所や顧客取引データ等は、複数の要素
から構成されている。例えば、住所は、都道府県名，市
区町村名，大字名，小字名，街区（丁目，番地，号），
建物名，部屋番号等の要素から構成され、顧客取引デー
タは、顧客番号，氏名，ふりがな等の要素から構成され
ている。また、住所や顧客取引データ等は、要素となり
得る要素単語が各要素毎に所定個数定まっている。例え
ば、都道府県名となり得る要素単語は、東京都，北海
道，大阪府，秋田県等の計４７個の単語である。

【０００３】ところで、住所や顧客取引データ等を文字
認識技術，或いは音声認識技術に基づいて認識する場
合、現在の認識技術では、全ての語を正しく、且つ一意
に認識することは不可能である。また、一部の要素単語
は入力時点で省略されている場合もあり得る。従って、
語の認識結果を並べて出力するだけでは、多くの認識誤
りや要素の不足が発生する。

【０００４】そこで、認識結果と予め登録されているデ
ータとを照合することにより、認識精度を高めるという
ことが従来から行われている。例えば、特開平１−１１
３８６５号公報に記載されている技術では、全ての顧客
について、顧客が取引時に伝票の所定の欄に記載する口
座番号，名前からなる顧客取引データを顧客情報記憶部
に予め格納しておき、顧客が伝票に記載した顧客取引デ
ータを認識する際には、先ず、手書き文字認識技術によ
って伝票に記載された口座番号，名前を認識し、次い
で、認識結果と顧客情報記憶部に格納されている全ての
顧客取引データとを照合することにより、全ての顧客取
引データ尤度を求める。その後、各顧客取引データの尤
度に基づいて認識結果とすべき顧客取引データを決定す
る。また、特開平４−３２８６９２号公報に記載されて
いる技術では、氏名とふりがなといった対となる要素を
単語辞書部に登録しておき、予め定められた枠内に記載
された氏名，ふりがなを認識する際、複数の候補文字と
単語辞書部に登録されている全ての対とを照合して単語
辞書部に登録されている対の尤度を求め、尤度の高いも
のから順に候補単語テーブルに登録するようにしてい
る。

【０００５】上述したように、従来の技術は、何れも要
素単語の組み合わせで表すことができる、実際に存在す
る認識対象情報を全て記憶部に予め格納しておき、認識
対象情報の認識時、文字認識技術による認識結果と記憶
部に予め格納されている全ての認識対象情報とを照合し
て各認識対象情報の尤度を求めるようにしている。ま
た、上述した従来の技術は、何れも認識対象情報の各要
素が予め定められている欄或いは枠内に記載されている
ことを前提にしている。

【０００６】

【発明が解決しようとする課題】上述した従来技術の問
題点は次の通りである。

【０００７】先ず、第１に、従来技術では、欄や枠によ
って要素単語の種類が予め指定されていない場合、対処
できない。例えば、郵便物上の住所のように自由記載文
字列の認識，或いは音声認識技術に基づく住所等の認識
に於いては、要素単語の種類はもとより、文字区切り，
単語区切りさえも確定していない。従って、従来の技術
に基づくならば、全ての文字区切り，単語区切り，要素
の種類を仮定し、それらの全ての組み合わせについて、
記憶部に格納されている全ての情報と照合処理を行うよ
うにすれば良いが、処理量が膨大になり現実的でない。

【０００８】第２に、従来の技術では、要素単語の認識
結果と記憶部中の要素単語とを直接比較しているので、
同一単語が何個も記憶部中に存在する場合、全く同じ尤
度算出処理を何度も繰り返し行ってしまい、効率が悪い
という問題がある。

【０００９】また、第３の問題点としては、要素の別表
現がある。例えば、住所の場合、地名を文字で表示する
のに、「筑波市」，「つくば市」のような異表記、また
丁目，番地，号等の街区の表記には漢数字，アラビア数
字が使用される。従来技術に基づいて、これに対処する
ためには、異表記も全て記憶部に格納しておくしか方法
がなく、記憶容量的にも尤度計算処理量的にも著しく効
率が悪い。

【００１０】そこで、本発明の目的は、単語区切り，要
素指定のない形式で入力された認識対象情報を、高速に
且つ精度良く認識することができ、更に、異表記が存在
するような場合であっても、記憶容量をあまり多くする
ことなく、認識対象情報を高速に且つ精度良く認識する
ことができる情報認識装置を提供することにある。

【００１１】

【課題を解決するための手段】本発明は、単語区切り，
要素指定のない形式で入力された認識対象情報を、高速
且つ精度良く認識できるようにするため、複数の要素か
ら構成され、且つ要素となり得る要素単語が各要素毎に
所定個数定まっている情報を認識対象情報とする情報認
識装置に於いて、要素となり得る要素単語が全て格納さ
れた単語記憶部と、各要素の階層関係を示す規則が格納
された規則記憶部と、認識対象情報中の各語を認識し、
その認識結果と前記単語記憶部の内容と前記規則記憶部
の内容とに基づいて前記認識対象情報中の各要素それぞ
れについて要素単語候補を求めると共に、各要素単語候
補の尤度を求める要素単語認識手段と、要素単語の組み
合わせで表すことができる、実際に存在する各認識対象
情報が、認識対象情報の各要素をレコード項目とするレ
コードの形で格納されたレコード格納部と、前記要素単
語認識手段で求められた各要素単語候補それぞれをキー
にして前記レコード格納部を検索することにより前記各
要素単語候補それぞれについてそれを含むレコードのレ
コード番号を獲得するレコード番号獲得手段と、該レコ
ード番号獲得手段で獲得されたレコード番号それぞれに
対応付けて尤度カウンタを設けると共に、前記要素単語
認識手段で求められた要素単語候補の尤度を、その要素
単語候補を含んでいるレコードのレコード番号に対応す
る尤度カウンタに加算する尤度計算手段と、前記各尤度
カウンタのカウント値に基づいて、認識結果とすべきレ
コードを判定する結果判定手段と、該結果判定手段の判
定結果に基づいて前記レコード格納部から認識結果とす
べきレコードを取り出す結果取り出し手段とを備えてい
る。

【００１２】上記した構成に於いては、要素単語認識手
段が、認識対象情報中の各語を認識し、更に、その認識
結果と単語記憶部の内容と規則記憶部の内容とに基づい
て認識対象情報中の各要素それぞれについて要素単語候
補を求めると共に、各要素単語候補の尤度を求める。次
いで、レコード番号獲得手段が、要素単語認識手段で求
められた各要素単語候補をキーにしてレコード格納部を
検索し、各要素単語候補それぞれについてそれを含むレ
コードのレコード番号を獲得する。その後、尤度計算手
段が、レコード番号獲得手段で獲得されたレコード番号
それぞれに対応付けて尤度カウンタを設けると共に、要
素単語認識手段で求めた各要素単語候補の尤度を、その
要素単語候補を含んでいるレコードのレコード番号に対
応する尤度カウンタに加算する。結果判定手段では、各
尤度カウンタのカウント値に基づいて認識対象情報の認
識結果とすべきレコードを判定し、結果取り出し手段
は、結果判定手段の判定結果に基づいてレコード格納部
から認識結果とすべきレコードを取り出す。

【００１３】また、本発明は、処理速度を更に高速化す
るため、限定レコード格納部と、前記要素単語認識手段
で求められた要素単語候補の中に、尤度が高く、且つ同
一単語が多くは含まれることのないレコード項目に対応
する要素単語候補が存在する場合に限り、その要素単語
候補をキーにして前記レコード格納部を検索し、前記要
素単語候補を含むレコードを前記限定レコード格納部に
格納するレコード限定手段とを備え、前記レコード番号
獲得手段は、前記限定レコード格納部にレコードが格納
されている場合は、前記要素単語認識手段で求められた
各要素単語候補それぞれをキーにして前記限定レコード
格納部を検索することにより前記各要素単語候補それぞ
れについてそれを含むレコードのレコード番号を獲得
し、前記限定レコード格納部にレコードが格納されてい
ない場合は、前記要素単語認識手段で求められた各要素
単語候補それぞれをキーにして前記レコード格納部を検
索することにより前記各要素単語候補それぞれについて
それを含むレコードのレコード番号を獲得する構成を有
し、前記結果取り出し手段は、前記結果判定手段の判定
結果に基づいて前記レコード格納部或いは前記限定レコ
ード格納部から認識結果とすべきレコードを取り出す構
成を有する。

【００１４】上記した構成に於いては、レコード限定手
段が、要素単語認識手段で求められた要素単語候補の中
に、尤度が高く、且つ同一単語が多くは含まれることの
ないレコード項目に対応する要素単語候補が存在する場
合に限り、その要素単語候補をキーにしてレコード格納
部を検索し、上記要素単語候補を含むレコードを限定レ
コード格納部に格納する。レコード番号獲得手段では、
限定レコード格納部にレコードが格納されている場合
は、要素単語認識手段で求められた各要素単語候補をキ
ーにして限定レコード格納部を検索し、各要素単語候補
それぞれについてそれを含むレコードのレコード番号を
獲得する。

【００１５】更に、本発明は、異表記が存在するような
場合であっても、記憶容量をあまり多くすることなく、
認識対象情報を高速に且つ精度良く認識できるようにす
るため、要素単語の代表表現と変形表現とが対応して格
納された要素単一化テーブル部と、前記要素単語認識手
段で求められた各要素単語候補の内、代表表現のものは
そのまま出力し、変形表現のものは前記要素単一化テー
ブル部の内容に基づいて代表表現に変換してから出力す
る要素単語単一化手段とを備え、前記レコード番号獲得
手段は、前記要素単語単一化手段から出力された各要素
単語候補それぞれをキーにして前記レコード格納部を検
索することにより前記各要素単語候補それぞれについて
それを含むレコードのレコード番号を獲得する構成を有
する。

【００１６】上記構成に於いては、要素単語単一化手段
が、要素単語認識手段で求められた各要素単語候補の
内、代表表現のものはそのまま出力し、変形表現のもの
は要素単一化テーブル部の内容に基づいて代表表現に変
換してから出力する。

【００１７】また、本発明は、結果判定手段の処理量を
減らし、処理を更に高速化するため、上位候補格納領域
と、前記各尤度カウンタ毎の上位候補登録済みフラグと
を備え、前記尤度計算手段は、尤度カウンタに尤度を加
算した時、その尤度カウンタのカウント値が予め定めら
れている閾値以上であり、且つ対応する上位候補登録済
みフラグが未登録を示している場合、前記上位候補登録
済みフラグを登録済みを示すものに変更すると共に、前
記上位候補格納領域に前記カウント値が前記閾値以上と
なった尤度カウンタに対応するレコード番号を格納する
構成を有し、前記結果判定手段は、前記上位候補格納領
域に格納されているレコード番号に対応する尤度カウン
タのカウント値に基づいて前記認識対象情報の認識結果
とすべき情報が格納されているレコードを判定する構成
を有する。

【００１８】上記構成に於いては、尤度計算手段は、尤
度カウンタに尤度を加算した時、その尤度カウンタのカ
ウント値が予め定められている閾値以上であり、且つ対
応する上位候補登録済みフラグが未登録を示している場
合、上位候補登録済みフラグを登録済みを示すものに変
更すると共に、上記した尤度カウンタに対応するレコー
ド番号を上位候補格納領域に格納する。その後、結果判
定手段が、上位候補格納領域に格納されているレコード
番号に対応する尤度カウンタのカウント値に基づいて認
識結果とすべき情報が格納されているレコードを判定す
る。

【００１９】

【発明の実施の形態】次に本発明の実施の形態について
図１を参照して詳細に説明する。

【００２０】要素単語認識手段１ａは、帳票や住所を構
成する要素単語の各々を認識し、尤度付きで複数候補を
出力する。要素単語認識手段１ａは、要素の種類に応じ
た複数個の認識手段から構成される。自由記載文字列に
対する文字認識や、音声認識による場合は、入力パター
ンから要素単語を切り出す処理もこの中に含まれる。規
則記憶部１ｂ及び単語記憶部１ｃには、各要素の認識処
理に使用する単語情報及び規則が格納されている。レコ
ード番号獲得手段１ｄは、要素単語認識手段１ａが出力
した要素単語候補を含むレコードを一意に識別するレコ
ード番号を、レコード格納部１ｅを検索することにより
獲得する。尤度計算手段１ｆは、レコード番号獲得手段
１ｄが獲得したレコード番号に対応する尤度カウンタ
に、要素単語認識手段１ａによって求められた要素単語
候補の尤度を加算する。尤度カウンタは、尤度記憶部１
ｇ内にある。結果判定手段１ｈは、尤度記憶部１ｇ内の
尤度カウンタの値に従い、尤度の高いレコードの中から
認識結果とするレコードのレコード番号を求める。結果
取り出し手段１ｉは、結果判定手段１ｈの判定結果のレ
コード番号に該当するレコードを、レコード格納部１ｅ
から取り出す。

【００２１】

【実施例】次に、本発明の実施例について説明する。

【００２２】図１は本発明の第１の実施例のブロック図
であり、要素単語認識手段１ａと、規則記憶部１ｂと、
単語記憶部１ｃと、レコード番号獲得手段１ｄと、レコ
ード格納部１ｅと、尤度計算手段１ｆと、尤度記憶部１
ｇと、結果判定手段１ｈと、結果取り出し手段１ｉとか
ら構成されている。

【００２３】単語記憶部１ｃには、認識対象情報の要素
となり得る要素単語が全て格納されている。例えば、或
る市区内の住所が認識対象情報である場合は、認識対象
情報の要素は、市区名，大字，小字，町名，丁目，番
地，号，建物名，部屋番号，個人名等であり、単語記憶
部１ｃには、上記した各要素となる得る要素単語が全て
格納されている。尚、当然のことではあるが、上記した
市区内に、同一建物名を有する建物が複数あったり、同
一個人名を有する個人が複数人存在しても、それらは、
１つだけ単語記憶部１ｃに格納される。

【００２４】規則記憶部１ｂには、認識対象情報中の各
要素単語を認識するための規則が格納されている。例え
ば、認識対象情報を住所とする場合は、都道府県名の次
に市区名が現れ、その次に町名が現れる等の地名の階層
関係を示す接続情報や、丁目の次に区切り記号が現れ、
その次に番地が現れる等の街区を生成する規則が格納さ
れる。

【００２５】要素単語認識手段１ａは、入力された認識
対象情報中の各語を認識し、その認識結果，規則記憶部
１ｂの内容，及び単語記憶部１ｃの内容に基づいて認識
対象情報中の各要素それぞれについて要素単語候補を求
めると共に、各要素単語候補の尤度を求める機能を有す
る。

【００２６】レコード格納部１ｅには、単語記憶部１ｃ
に格納された要素単語の組み合わせで表すことができ
る、実際に存在する認識対象情報が、レコードの形式で
格納される。このレコードは、認識対象情報の各要素に
対応するレコード項目から構成される。

【００２７】レコード番号獲得手段１ｄは、要素単語認
識手段１ａで求められた各要素単語候補それぞれをキー
にしてレコード格納部１ｅを検索し、各要素単語候補そ
れぞれについてそれを含むレコードのレコード番号を獲
得する機能を有する。

【００２８】尤度計算手段１ｆは、レコード番号獲得手
段１ｄで獲得されたレコード番号それぞれに対応付けて
尤度記憶部１ｇ内に尤度カウンタを設けると共に、要素
単語認識手段１ａで求めた要素単語候補の尤度を尤度カ
ウンタの内の、その要素単語候補を含んでいるレコード
のレコード番号に対応する尤度カウンタに加算する機能
を有する。

【００２９】結果判定手段１ｈは、尤度記憶部１ｇ内に
設けられた各尤度カウンタのカウント値に基づいて認識
対象情報の認識結果とすべきレコードのレコード番号を
判定する機能を有する。

【００３０】結果取り出し手段１ｉは、結果判定手段１
ｈの判定結果であるレコード番号に基づいて、レコード
格納部１ｅから認識結果とすべきレコードを取り出す機
能を有する。

【００３１】図２は要素単語認識手段１ａの処理例を示
す流れ図、図３はレコード番号獲得手段１ｄの処理例を
示す流れ図、図４は尤度計算手段１ｆの処理例を示す流
れ図、図５は結果判定手段１ｈの処理例を示す流れ図、
図６は結果取り出し手段１ｉの処理例を示す流れ図であ
る。

【００３２】以下に、「神奈川県川崎市宮前区」内の住
所を認識対象情報とした場合を例にとって本実施例の動
作を説明する。

【００３３】今、例えば、用紙に記載された図７に示す
住所を認識する場合について考えてみる。要素単語認識
手段１ａには、例えば、光学的パターン入力装置（図示
せず）から図７に示した住所（認識対象情報）に対応す
る入力パターンが入力される。

【００３４】要素単語認識手段１ａは、認識対象情報に
対応する入力パターンが入力されると、図２の流れ図に
示すように、語の切り出し処理を行い、更に、切り出し
た各語について認識処理を行う（Ｓ１，Ｓ２）。その
際、要素単語認識手段１ａは、各語に対する認識結果の
尤度を求めておく。

【００３５】その後、要素単語認識手段１ａは、各語に
対する認識結果と、規則記憶部１ｂの内容と、単語記憶
部１ｃの内容とに基づいて、各要素それぞれに対する要
素単語候補を求め、求めた要素単語候補をレコード番号
獲得手段１ｄへ出力する（Ｓ３）。その際、要素単語認
識手段１ａは、求めた要素単語候補と単語記憶部１ｃに
格納されている要素単語との適合度，規則記憶部１ｂに
格納されている規則との適合度、及び既に求めてある各
語に対する認識結果の尤度に基づいて、各要素単語候補
の尤度も求め、それもレコード番号獲得手段１ｄへ出力
する。尚、各住所要素を認識する技術としては、ＮＥＣ
技報（第４４巻３号，２５〜３０頁）「郵政省向け郵便
物あて名自動読み取り区分機」に記載された技術や、東
芝レビュー（第４５巻２号１４９〜１５２頁）「郵便物
あて名自動読み取り区分機」等、既に実用的な技術があ
る。

【００３６】図８は、図７に示した住所に対する要素単
語認識手段１ａの出力例を示した図である。この例は、
地名に対しては尤度がそれぞれ「１０」，「８」，
「４」の要素単語候補「宮崎」，「宮前平」，「有馬」
が、丁目に対しては尤度が「１０」の要素単語候補
「４」が、番地に対しては尤度がそれぞれ「１０」，
「７」の要素単語候補「７」，「１７」が、号および建
物名に対しては要素単語候補がないことを示す「？」と
尤度「０」が、部屋番号に対しては尤度がそれぞれ「１
０」，「５」の要素単語候補「２０７」，「２０１」
が、氏名に対しては尤度が共に「１０」の要素単語候補
「日電太郎」，「日雷次郎」が出力されたことを示して
いる。ここで、建物名は記載時に省略されているため
に、要素単語候補なしを示す「？」が出力され、号は記
載されているが認識不能であるために要素単語候補なし
を示す「？」が出力されたものである。また、図８の例
では、町名より下層の要素についてのみ要素単語候補を
出力するようにしているが、これは、認識対象を「川崎
市宮前区」内の住所としているためである。

【００３７】要素単語認識手段１ａから図８に示した情
報が出力されると、レコード番号獲得手段１ｄは、図３
の流れ図に示す処理を行う。

【００３８】レコード番号獲得手段１ｄは、先ず、地
名，丁目，番地，号，建物名，部屋番号，氏名の各要素
の内、１つを処理対象とする（Ｓ１１）。今、例えば、
地名を処理対象にしたとする。

【００３９】次いで、レコード番号獲得手段１ｄは、地
名に対する要素候補単語「宮崎」，「宮前平」，「有
馬」の内の１つを処理対象とする（Ｓ１３）。今、例え
ば、「宮崎」を処理対象にしたとする。

【００４０】その後、レコード番号獲得手段１ｄは、処
理対象とした要素単語候補「宮崎」をキーにしてレコー
ド格納部１ｅを検索し、地名のレコード項目に「宮崎」
を含むレコードのレコード番号を全て獲得する（Ｓ１
５）。その結果、地名のレコード項目に「宮崎」を含む
レコードのレコード番号として、例えば、「２０１４〜
３５００」が獲得されたとする。

【００４１】図９はレコード格納部１ｅの内容例を示し
た図であり、レコード格納部１ｅに格納されたレコード
は、「レコード番号」，「地名」，「丁目」，「番
地」，「号」，「建物名」，「部屋番号」，「氏名」の
レコード項目から構成されている。尚、図９に於いて、
空欄となっているレコード項目は、該当要素がないこと
を示している。

【００４２】その後、レコード番号獲得手段１ｄは、
「地名」に対する要素単語候補「宮前平」，「有馬」を
順次処理対象にして前述したと同様の処理を行う（Ｓ１
３〜Ｓ１５）。

【００４３】そして、「地名」に対する要素単語候補の
中に、未処理のものがなくなると（Ｓ１４がＹＥＳ）、
レコード番号獲得手段１ｄは、未処理の要素の内の１つ
を処理対象とし（Ｓ１１）、その処理対象に対して前述
したと同様の処理を行う（Ｓ１３〜Ｓ１５）。

【００４４】上述した処理を全ての要素に対して行うと
（Ｓ１２がＹＥＳ）、レコード番号獲得手段１ｄは、各
要素単語候補毎に、その尤度とＳ１５で獲得したレコー
ド番号とを対にして尤度計算手段１ｆに渡す（Ｓ１
６）。

【００４５】図１０は、レコード番号獲得手段１ｄの出
力例を示した図である。同図に示すように、レコード番
号獲得手段１ｄからは、「地名」のレコード項目に「有
馬」を含むレコードのレコード番号「０００１〜０５２
３」と尤度「４」との対，「地名」のレコード項目に
「宮崎」を含むレコードのレコード番号「２０１４〜３
５００」と尤度「１０」との対等が出力される。

【００４６】尚、レコード番号獲得手段１ｄに於ける検
索処理を高速化するため、一般のデータベースで行われ
るように、検索のためのデータ構造、例えばハッシュ表
等を別に用意するようにしても良い。また、要素単語認
識手段１ａから出力される可能性のある全ての要素単語
候補について、その要素を含むレコードのレコード番号
リストを用意しておくようにしても良い。このようにす
ると、レコード番号の獲得処理時間は非常に短くなる
が、要素単語とレコード番号の対応関係を格納しておく
記憶領域が必要になる。従って、レコード格納部１ｅに
格納されているレコード数，要素単語の種類の数，ハー
ドウェア的な制約を考慮して、全ての要素単語について
レコードリストを設けたり、一部の要素単語についての
みレコードリストを設けたりすることが望ましい。

【００４７】レコード番号獲得手段１ｄから、図１０に
示すように、レコード番号と尤度との対が複数出力され
ると、尤度計算手段１ｆは、図４の流れ図に示すよう
に、未処理の対の内の１つを処理対象とする（Ｓ２
１）。今、例えば、図１０に示すレコード番号と尤度と
の対の内の、レコード番号「０００１〜０５２３」と尤
度「４」とからなる対を処理対象にしたとする。

【００４８】次いで、レコード番号獲得手段１ｄは、処
理対象とした対に含まれているレコード番号「０００１
〜０５２３」の内の１つを処理対象にする（Ｓ２３）。
今、例えば、レコード番号「０００１」を処理対象にし
たとする。

【００４９】その後、レコード番号獲得手段１ｄは、処
理対象としたレコード番号「０００１」に対応する尤度
カウンタを既に尤度記憶部１ｇ内に作成済みが否かを判
断する（Ｓ２５）。

【００５０】そして、作成済みでないと判断した場合
（Ｓ２５がＮＯ）は、図１１に示すような尤度カウンタ
１１ａを尤度記憶部１ｇ内に作成する（Ｓ２６）。尤度
カウンタ１１ａは、レコード番号部１１ｂと尤度部１１
ｃとから構成される。レコード番号部１１ｂには、現在
処理対象としているレコード番号「０００１」が格納さ
れ、尤度部１１ｃには初期値「０」が格納される。

【００５１】レコード番号「０００１」に対応する尤度
カウンタ１１ａを尤度記憶部１ｇ内に作成すると、その
尤度部１１ｃに現在処理対象にしている対に含まれてい
る尤度「４」を加算する（Ｓ２７）。尚、Ｓ２５で現在
処理対象としているレコード番号に対応する尤度カウン
タが作成済みであると判断した場合は、Ｓ２６の処理は
行わずに、直ちにＳ２７の処理を行う。

【００５２】その後、尤度計算手段１ｆは、現在処理対
象としている対に含まれている未処理のレコード番号に
ついて前述したと同様の処理を順次行う（Ｓ２３〜Ｓ２
７）。

【００５３】そして、現在処理対象としている対に含ま
れているレコード番号の中に未処理のものがなくなると
（Ｓ２４がＹＥＳ）、未処理の対の内の１つを処理対象
にして前述したと同様の処理を行う（Ｓ２１〜Ｓ２
７）。

【００５４】上述した処理を、レコード番号獲得手段１
ｄから渡された全てのレコード番号と尤度の対に対して
行うと（Ｓ２２がＹＥＳ）、尤度計算手段１ｆは、図１
２に示すように、尤度記憶部１ｇ内に存在する尤度カウ
ンタ１１ａを、尤度部１１ｃに設定されている尤度が大
きいものから順番にソートし、その後、結果判定手段１
ｈに対して処理終了を通知する（Ｓ２８，Ｓ２９）。
尚、図１２に於いては、尤度の加算内容も示したが、こ
れは理解を助けるためのものであり、尤度記憶部１ｇ内
に実際に格納されているものではない。

【００５５】尤度計算手段１ｆから処理終了が通知され
ると、結果判定手段１ｈは、図５の流れ図に示すよう
に、尤度記憶部１ｇ内に存在する尤度カウンタ１１ａの
内、尤度部１１ｃに格納されている尤度が最も大きな尤
度カウンタ１１ａを選択し（Ｓ３１）、選択した尤度カ
ウンタ１１ａのレコード番号部１１ｂに格納されている
レコード番号を認識結果とするレコードのレコード番号
として出力する（Ｓ３２）。本実施例では、上記したよ
うに、尤度部１１ｃに設定されている尤度が最も大きな
尤度カウンタ１１ａに対応するレコード番号を無条件に
出力するようにしたが、第１，第２の閾値Ｔｈ１，Ｔｈ
２を定めておき、尤度部１１ｂに設定されている尤度が
最も大きな尤度カウンタ（第１候補尤度カウンタ）と尤
度部１１ｂに設定されている尤度が２番目に大きい尤度
カウンタ（第２候補尤度カウンタ）の尤度部１１ｂに設
定されている尤度の差が第１の閾値Ｔｈ１より大きく、
且つ第１候補尤度カウンタの尤度部１１ｂに設定されて
いる尤度が第２の閾値Ｔｈ２よりも大きい場合のみ、第
１候補尤度カウンタのレコード番号部１１ｂに設定され
ているレコード番号を結果判定手段１ｈに対して出力
し、それ以外の場合は認識不能を結果判定手段１１ｈに
対して通知するようにしても良い。このようにすること
により、誤った認識結果が出力される危険性を少なくす
ることができる。

【００５６】結果判定手段１ｈからレコード番号が出力
されると、結果取り出し手段１ｉは、図６の流れ図に示
すように、レコード格納部１ｅから上記レコード番号の
レコードを取り出し、取り出したレコードの内容を認識
結果として出力する（Ｓ４１，Ｓ４２）。

【００５７】本実施例では、住所の認識範囲を川崎市宮
前区内に限定したが、地域を広げることも容易である。
即ち、本実施例では市区名より下層の住所要素だけを対
象にして、レコード番号獲得手段１ｄでレコード番号を
獲得し、尤度計算手段１ｆで尤度加算を行ったが、要素
単語認識手段１ａで認識した県名，市区名も住所要素と
して処理を実施すれば良い。異なる市区内に同一町名が
あっても、処理に何の変更も必要ない。但し、単語記憶
部１ｃ及びレコード格納部１ｅにも、認識対象の県名，
市区名等を追加する必要があることは当然である。

【００５８】また、本実施例により、複数の要素単語候
補の組み合わせの中からもっともらしいレコードを効率
良く選び出すことは可能であるが、対象となる住所のレ
コード数が多いと、加算処理後の尤度比較処理の負荷が
大きくなるという問題がある。図１２に示した例では、
尤度カウンタを尤度部に設定されている尤度に従ってソ
ートしたが、尤度カウンタは、最大でレコード格納部１
ｅのレコード数だけ必要であり、そのソートや尤度上位
候補抽出には時間がかかる。さて、通常、尤度部の値が
或る値よりも大きくなる尤度カウンタの数は少なく、ほ
とんどの尤度カウンタの尤度部の値は、「０」か小さな
値となる。その点に着目すると、尤度記憶部１ｇに、図
１３に示すように、上位候補格納領域１３ａを設けると
共に、各尤度カウンタ１１ａに対応して上位候補登録済
みフラグ１１ｄを設けることにより、処理を高速化でき
る。この場合、尤度計算手段１ｆは、或る尤度カウンタ
１１ａの尤度部１１ｃに尤度を加算する毎に、加算後の
尤度部１１ｃの値と登録閾値Ｔｈとを比較する。そし
て、もし、尤度部１１ｃの値が登録閾値Ｔｈ以上であ
り、且つ上位候補登録済みフラグ１１ｄが未登録を示す
「０」であるなら、上記尤度カウンタ１１ａのレコード
番号部１１ｂに格納されているレコード番号を上位候補
格納領域１３ａに登録すると共に、対応する上位候補登
録済みフラグ１１ｄを、未登録を示す「０」から登録済
みを示す「１」に変更する。ここで、上位候補登録済み
フラグ１１ｄを設けるのは、同一レコード番号の重複登
録を防ぐためである。以上の処理を行うことにより、尤
度部１１ｃの値が登録閾値Ｔｈ以上の尤度カウンタ１１
ａに対応するレコード番号のみが上位候補格納領域１３
ａに格納されることになるので、上位候補を取り出すた
めの処理が大幅に限定される。図１３では、登録閾値Ｔ
ｈを「１０」にした例を示したが、状況に応じた設定変
更で、処理速度と精度のトレードオフを容易にとること
ができる。尚、登録閾値を大きくすると、認識結果なし
の判定が増え、小さくすると処理時間が増大する。

【００５９】以上のように、本実施例によれば、自由記
載の住所に対して、一部の要素単語が記載時に省略され
ている、認識不能が発生している、或いは要素単語の誤
読が起こっている等の条件下でも、効率良く、正しい認
識結果を出力することが可能となる。

【００６０】図１４は本発明の第２の実施例のブロック
図である。本実施例と図１に示した第１の実施例との相
違は、レコード限定手段１４ａ及び限定レコード格納部
１４ｃを備えた点、レコード番号獲得手段１ｄに代えて
レコード番号獲得手段１４ｂを備えた点、及び結果取り
出し手段１ｉに代えて結果取り出し手段１４ｄを備えた
点である。尚、他の第１図と同一符号は同一部分を表し
ている。

【００６１】レコード限定手段１４ａは、要素単語認識
手段１ａで求められた要素単語候補の中に、尤度が高
く、且つ同一単語が多くは含まれることのないレコード
項目に対応する要素単語候補が存在する場合は、その要
素単語候補をキーにしてレコード格納部１ｅを検索する
ことにより得られた上記要素単語候補を含むレコードを
限定レコード格納部１４ｃに格納すると共にレコード番
号獲得手段１４ｂに対して限定レコード格納部１４ｃを
検索対象にすることを指示し、上記条件を満たす要素単
語候補が存在しない場合は、レコード番号獲得手段１４
ｂに対してレコード格納部１ｅを検索対象にすることを
指示する機能を有する。

【００６２】レコード番号獲得手段１４ｂは、レコード
格納部１ｅを検索対象にすることが指示された場合に
は、要素単語認識手段１ａで求められた各要素単語候補
をキーにしてレコード格納部１ｅを検索し、各要素単語
候補それぞれについてそれを含むレコードのレコード番
号を獲得し、限定レコード格納部１４ｃを検索対象にす
ることが指示された場合には、要素単語認識手段１ａで
求められた各要素単語候補をキーにして限定レコード格
納部１４ｃを検索し、各要素単語候補それぞれについて
それを含むレコードのレコード番号を獲得する機能を有
する。

【００６３】結果取り出し手段１４ｄは、結果判定手段
１ｈの判定結果であるレコード番号に基づいて、限定レ
コード格納部１４ｃから認識結果とすべきレコードを取
り出す機能を有する。

【００６４】図１５は、レコード限定手段１４ａの処理
例を示す流れ図であり、以下各図を参照して本実施例の
動作を説明する。

【００６５】住所や取引データを構成する要素は、その
種類毎に該当するレコードを限定する能力が異なること
が多い。例えば、住所を例にとると、市区名，町名，街
区，部屋番号等ではあまりレコードを限定できないが、
氏名，建物名は、正しく認識されていれば、レコードを
限定する効果が大きい。従って、レコード限定能力の高
い要素が正しく認識できた場合、それによって処理する
レコードの範囲を限定し、その範囲に対して残りの要素
単語による処理を行うことにより、処理量を大幅に削減
することができる。本実施例は、この点に着目したもの
である。

【００６６】レコード限定手段１４ａは、要素単語認識
手段１ａから要素単語候補が出力されると、図１５の流
れ図に示すように、その中に尤度が高く、且つレコード
限定能力の高い要素単語候補が存在するか否かを調べる
（Ｓ５１）。

【００６７】そして、上記条件を満たす要素単語候補が
存在しない場合（Ｓ５２がＮＯ）は、レコード限定手段
１４ａは、レコード番号獲得手段１４ｂに対してレコー
ド格納部１ｅを検索対象にすることを指示する（Ｓ５
５）。レコード番号獲得手段１４ｂは、レコード格納部
１ｅを検索対象にすることが指示されると、図１に示し
たレコード番号獲得手段１ｄと同様の処理を行う。

【００６８】また、上記条件を満たす要素単語候補が存
在する場合（Ｓ５２がＹＥＳ）は、レコード限定手段１
４ａは、レコード格納部１ｅから上記上位要素単語候補
を含むレコードを全て取り出し、取り出したレコードを
限定レコード格納部１４ｃに格納する（Ｓ５３）。その
後、レコード限定手段１４ａは、レコード番号獲得手段
１４ｂに対して、検索対象を限定レコード格納部１４ｃ
とすることを指示する（Ｓ５４）。これにより、レコー
ド番号獲得手段１４ｂは、要素単語認識手段１ａが求め
た各要素単語候補をそれぞれキーにして限定レコード格
納部１４ｃを検索し、上記要素単語候補を含むレコード
のレコード番号を獲得する。

【００６９】尤度計算手段１ｆ，結果判定手段１ｈは、
前述したと同様の処理を行い、結果取り出し手段１４ｄ
は、結果判定手段１ｈから出力されたレコード番号に該
当するレコードを、限定レコード格納部１４ｃから取り
出し、取り出したレコードを認識結果として出力する。
尚、結果判定手段１ｈから出力されたレコード番号に該
当するレコードを、レコード格納部１ｅから取り出すよ
うにしても良いが、限定レコード格納部１４ｃの方がレ
コード格納部１ｅより格納レコード数が少ないので、限
定レコード格納部１４ｃからレコードを取り出す方が処
理を高速化できる。

【００７０】ところで、本実施例では、特定の要素単語
に依存して処理対象とするレコードを限定しているた
め、限定に使用した要素単語の認識精度が全体の認識精
度に大きく影響してしまうという問題を持つ。これを解
決するためには、結果判定手段１ｈに於ける第１，第２
の閾値Ｔｈ１，Ｔｈ２の値を大きくし、尤度が十分高
く、第１候補尤度カウンタに設定されている尤度と第２
候補尤度カウンタに設定されている尤度との差が十分に
大きくなければ、積極的にリジェクトの判定を下すとい
う対策をとることができる。更に、このように厳しい判
定によってリジェクトが起こった場合には、限定レコー
ド格納部１４ｃを使用せずに、第１の実施例と同様に、
レコード格納部１ｅを使用して処理を行う等して、シス
テム全体の平均的な速度と精度のバランスをとることも
可能である。

【００７１】図１６は、本発明の第３の実施例のブロッ
ク図である。図１に示した第１の実施例と異なる点は、
要素単語単一化手段１６ａ及び要素単一化テーブル部１
６ｂを設けた点である。尚、他の図１と同一符号は同一
部分を表している。

【００７２】要素単一化テーブル部１６ｂには、要素単
語の代表表現と変形表現とが対応して格納されている。

【００７３】要素単語単一化手段１６ａは、要素単語認
識手段１ａで求められた各要素単語候補それぞれについ
て、それが代表表現であるか、変形表現であるかを要素
単一化テーブル部１６ｂの内容に基づいて判定し、代表
表現のものはそのまま、異表記等の変形表現のものは代
表表現に変換してから出力する機能を有する。

【００７４】住所等に於いては、同一の意味を持つ要素
単語が異なる表現となる場合がある。例えば、「日の出
町」は、「日乃出町」，「日ノ出町」等の表現される場
合がある。また、住所氏名がカタカナで記載されること
もある。或いは、街区を文字列で表現した時、数字がア
ラビア数字である場合も、漢数字である場合もある。要
素単語単一化手段１６ａは、このような複数の表現をレ
コード格納部１ｅで使用されている代表表現に単一化す
る。これにより、異表記を含むレコードを別途レコード
格納部１ｅに格納する必要はなく、記憶容量及び処理時
間の節約が可能となる。尚、本実施例のその他の処理は
図１に示した第１の実施例と同じである。

【００７５】図１７は、要素単一化テーブル部１６ｂの
内容例を示した図である。要素単一化テーブル部１６ｂ
の内容を同図に示すものとしておくことにより、要素単
語認識手段１ａが、「日の出町」，「日ノ出町」，「日
乃出町」「ヒノデチョウ」の何れを出力しても、「日の
出町」に単一化されるので、レコード格納部１ｅには
「日の出町」を用いたレコードだけを登録しておけば良
い。更に、要素単語単一化手段１６ａは、必ずしも単語
記憶部１ｃに格納されている要素単語のどれかの文字列
に単一化する必要はなく、或る識別コードに単一化する
ようにしても良い。但し、この場合は、要素単語の代わ
りに上記識別コードをレコード格納部に格納しておくこ
とが必要となる。更に、識別コードを文字列データでな
く、数値データとしてレコード格納部１ｅに格納すれ
ば、レコード格納部１ｅの記憶量を削減することができ
る。

【００７６】地名等の文字列を単一化する場合には、上
記したように、要素単一化テーブル部１６ｂを用いる方
式が望ましいが、街区表示に於ける数字列の場合は、要
素単一化テーブル部１６ｂを用いる方式よりも、要素単
語単一化手段１６ａ内に、漢数字をアラビア数字に変換
する変換手段或いはアラビア数字を漢数字に変換する変
換手段を用意する形態の方が現実的である。

【００７７】以上の処理により、要素単語が代表表現と
異なる表現で現れても、効率良く、且つ認識精度良く、
認識対象情報を認識することができる。

【００７８】尚、上述した実施例に於いては、文字認識
技術を用いて、入力パターン中の各語を認識するように
したが、入力パターンを音声パターンとし、音声認識技
術を用いて入力パターン中の各語を認識するようにする
こともできる。

【００７９】

【発明の効果】以上説明したように、本発明は、認識対
象情報を認識する際、要素単語認識手段で、認識対象情
報中の各語の認識結果と単語記憶部の内容と規則記憶部
の内容とに基づいて認識対象情報中の各要素それぞれの
要素単語候補及び各要素単語候補の尤度を求め、その
後、尤度計算手段で、要素単語認識手段が求めた要素単
語候補及び各要素単語候補の尤度に基づいて要素単語候
補を含む各レコードの尤度を求めるようにしたものであ
るので、単語区切り，要素指定のない形式で入力された
認識対象情報を、高速且つ精度良く認識できる。つま
り、要素単語認識手段に於いて各要素単語候補の尤度を
求める処理は、単語記憶部に格納されている要素単語の
数がレコード格納部に格納されているレコードの数に比
較してはるかに少ないものであるので、レコード格納部
に格納されている全てのレコードと各要素単語候補とを
直接照合して各レコードの尤度を求めるという従来行わ
れていた処理に比較してはるかに処理量が少なく、ま
た、要素単語候補を含む各レコードの尤度を求める処理
も尤度計算手段で尤度カウンタに要素単語候補の尤度を
加算するだけで良いので、従来の技術に比較してはるか
に処理量が少ない。従って、本発明によれば、処理を高
速化することができる。

【００８０】更に、各尤度カウンタのカウント値に基づ
いて認識対象とする情報が格納されているレコードを判
定する結果判定手段と、結果判定手段の判定結果に基づ
いて認識結果とするレコードを取り出す結果取り出し手
段とを備えているので、一部の要素単語が省略されてい
る場合であっても、正しい認識結果を得ることができ
る。

【００８１】また、本発明は、要素単語認識手段で求め
られた要素単語候補の中に、尤度が高く、且つレコード
限定能力の高い要素単語候補が存在する場合、その要素
単語候補を含むレコードを限定レコード格納部に格納す
るレコード限定手段を備えているので、認識処理を更に
高速化することができる。

【００８２】また、本発明は、要素単語の代表表現とそ
の変形表現とが対応して格納された要素単一化テーブル
部と、この要素単一化テーブル部の内容に基づいて変形
表現を代表表現に変換する要素単語単一化手段を備えて
いるので、異表記が存在するような場合であっても、記
憶容量をあまり多くすることなく、認識対象情報を高速
に且つ精度良く認識することができる。

【００８３】また、本発明は、尤度カウンタに尤度を加
算した際、カウント値が閾値以上になった尤度カウンタ
に対応するレコード番号を上位候補格納領域に格納する
ようにし、結果判定手段では、上位候補格納領域に格納
されているレコード番号のレコードの尤度のみを対象に
して処理を行うので、処理速度を更に高速化することが
できる。

【図面の簡単な説明】

【図１】本発明の第１の実施例のブロック図である。

【図２】要素単語認識手段１ａの処理例を示す流れ図で
ある。

【図３】レコード番号獲得手段１ｄの処理例を示す流れ
図である。

【図４】尤度計算手段１ｆの処理例を示す流れ図であ
る。

【図５】結果判定手段１ｈの処理例を示す流れ図であ
る。

【図６】結果取り出し手段１ｉの処理例を示す流れ図で
ある。

【図７】認識対象情報の一例を示す図である。

【図８】要素単語認識手段１ａの出力例を示す図であ
る。

【図９】レコード格納部１ｅの内容例を示す図である。

【図１０】レコード番号獲得手段１ｄの出力例を示す図
である。

【図１１】尤度カウンタ１１ａの構成例を示す図であ
る。

【図１２】尤度計算手段１ｆの処理を説明するための図
である。

【図１３】尤度計算手段１ｆの処理を説明するための図
である。

【図１４】本発明の第２の実施例のブロック図である。

【図１５】レコード限定手段１４ａの処理例を示す流れ
図である。

【図１６】本発明の第３の実施例のブロック図である。

【図１７】要素単一化テーブル部１６ｂの内容例を示す
図である。

【符号の説明】

１ａ…要素単語認識手段１ｂ…規則記憶部１ｃ…単語記憶部１ｄ…レコード番号獲得手段１ｅ…レコード格納部１ｆ…尤度計算手段１ｇ…尤度記憶部１ｈ…結果判定手段１ｉ…結果取り出し手段１１ａ…尤度カウンタ１１ｂ…レコード番号部１１ｃ…尤度部１１ｄ…上位候補登録済みフラグ１４ａ…レコード限定手段１４ｂ…レコード番号獲得手段１４ｃ…限定レコード格納部１４ｄ…結果取り出し手段１６ａ…要素単語単一化手段１６ｂ…要素単一化テーブル部

Claims

【特許請求の範囲】

【請求項１】複数の要素から構成され、且つ要素とな
り得る要素単語が各要素毎に所定個数定まっている情報
を認識対象情報とする情報認識装置に於いて、要素となり得る要素単語が全て格納された単語記憶部
と、各要素の階層関係を示す規則が格納された規則記憶部
と、認識対象情報中の各語を認識し、その認識結果と前記単
語記憶部の内容と前記規則記憶部の内容とに基づいて前
記認識対象情報中の各要素それぞれについて要素単語候
補を求めると共に、各要素単語候補の尤度を求める要素
単語認識手段と、要素単語の組み合わせで表すことができる、実際に存在
する各認識対象情報が、認識対象情報の各要素をレコー
ド項目とするレコードの形で格納されたレコード格納部
と、前記要素単語認識手段で求められた各要素単語候補それ
ぞれをキーにして前記レコード格納部を検索することに
より前記各要素単語候補それぞれについてそれを含むレ
コードのレコード番号を獲得するレコード番号獲得手段
と、該レコード番号獲得手段で獲得されたレコード番号それ
ぞれに対応付けて尤度カウンタを設けると共に、前記要
素単語認識手段で求められた要素単語候補の尤度を、そ
の要素単語候補を含んでいるレコードのレコード番号に
対応する尤度カウンタに加算する尤度計算手段と、前記各尤度カウンタのカウント値に基づいて、認識結果
とすべきレコードを判定する結果判定手段と、該結果判定手段の判定結果に基づいて前記レコード格納
部から認識結果とすべきレコードを取り出す結果取り出
し手段とを備えたことを特徴とする情報認識装置。
【請求項２】限定レコード格納部と、前記要素単語認識手段で求められた要素単語候補の中
に、尤度が高く、且つ同一単語が多くは含まれることの
ないレコード項目に対応する要素単語候補が存在する場
合に限り、その要素単語候補をキーにして前記レコード
格納部を検索し、前記要素単語候補を含むレコードを前
記限定レコード格納部に格納するレコード限定手段とを
備え、前記レコード番号獲得手段は、前記限定レコード格納部
にレコードが格納されている場合は、前記要素単語認識
手段で求められた各要素単語候補それぞれをキーにして
前記限定レコード格納部を検索することにより前記各要
素単語候補それぞれについてそれを含むレコードのレコ
ード番号を獲得し、前記限定レコード格納部にレコード
が格納されていない場合は、前記要素単語認識手段で求
められた各要素単語候補それぞれをキーにして前記レコ
ード格納部を検索することにより前記各要素単語候補そ
れぞれについてそれを含むレコードのレコード番号を獲
得する構成を有し、前記結果取り出し手段は、前記結果判定手段の判定結果
に基づいて前記レコード格納部或いは前記限定レコード
格納部から認識結果とすべきレコードを取り出す構成を
有することを特徴とする請求項１記載の情報認識装置。
【請求項３】要素単語の代表表現と変形表現とが対応
して格納された要素単一化テーブル部と、前記要素単語認識手段で求められた各要素単語候補の
内、代表表現のものはそのまま出力し、変形表現のもの
は前記要素単一化テーブル部の内容に基づいて代表表現
に変換してから出力する要素単語単一化手段とを備え、前記レコード番号獲得手段は、前記要素単語単一化手段
から出力された各要素単語候補それぞれをキーにして前
記レコード格納部を検索することにより前記各要素単語
候補それぞれについてそれを含むレコードのレコード番
号を獲得する構成を有することを特徴とする請求項１記
載の情報認識装置。
【請求項４】上位候補格納領域と、前記各尤度カウンタ毎の上位候補登録済みフラグとを備
え、前記尤度計算手段は、尤度カウンタに尤度を加算した
時、その尤度カウンタのカウント値が予め定められてい
る閾値以上であり、且つ対応する上位候補登録済みフラ
グが未登録を示している場合、前記上位候補登録済みフ
ラグを登録済みを示すものに変更すると共に、前記上位
候補格納領域に前記カウント値が前記閾値以上となった
尤度カウンタに対応するレコード番号を格納する構成を
有し、前記結果判定手段は、前記上位候補格納領域に格納され
ているレコード番号に対応する尤度カウンタのカウント
値に基づいて前記認識対象情報の認識結果とすべきレコ
ードを判定する構成を有することを特徴とする請求項
１，２または３記載の情報認識装置。
【請求項５】前記要素単語認識手段は、前記認識対象
情報中の各語を文字認識により認識することを特徴とす
る請求項１，２，３または４記載の情報認識装置。
【請求項６】前記要素単語認識手段は、前記認識対象
情報中の各語を音声認識により認識することを特徴とす
る請求項１，２，３または４記載の情報認識装置。
【請求項７】前記単語記憶部に格納された認識対象情
報の要素となり得る要素単語は、郵便番号，地名，街
区，組織名，建物名，個人であり、前記レコード格納部に格納された認識対象情報は、前記
要素単語の組み合わせとして表すことができる実際に存
在する住所であることを特徴とする請求項１，２，３，
４，５または６記載の情報認識装置。
【請求項８】前記単語記憶部に格納された認識対象情
報の要素となり得る要素単語は、顧客番号，氏名，ふり
がなであり、前記レコード格納部に格納された認識対象情報は、前記
要素単語の組み合わせとして表すことができる実際に存
在する顧客取引データであることを特徴とする請求項
１，２，３，４，５または６記載の情報認識装置。