JPH11120290A - 文字認識装置及びその方法、コンピュータ可読メモリ - Google Patents

文字認識装置及びその方法、コンピュータ可読メモリ

Info

Publication number
JPH11120290A
JPH11120290A JP9286992A JP28699297A JPH11120290A JP H11120290 A JPH11120290 A JP H11120290A JP 9286992 A JP9286992 A JP 9286992A JP 28699297 A JP28699297 A JP 28699297A JP H11120290 A JPH11120290 A JP H11120290A
Authority
JP
Japan
Prior art keywords
character
character recognition
candidate
word
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP9286992A
Other languages
English (en)
Inventor
Masanobu Funakoshi
正伸 船越
Haruki Nakakoshi
治樹 中越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP9286992A priority Critical patent/JPH11120290A/ja
Publication of JPH11120290A publication Critical patent/JPH11120290A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 認識率を向上することができる文字認識装置
及びその方法を提供する。 【解決手段】 SCAN9から入力された画像データに
対し文字認識を行う。文字認識によって出力された候補
文字列の各文字がひらがなあるいは漢字であるか否かを
判定する。判定結果に基づいて、候補文字列から構成さ
れる部分文字列に対し、単語辞書WDIC(3a)を参
照して言語処理を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力された画像デ
ータに対し文字認識を行う文字認識装置及びその方法、
コンピュータ可読メモリに関するものである。
【0002】
【従来の技術】一般の文字認識装置では、光学センサを
用いて原稿画像を読み取り、読み取った画像における文
字列において文字の切り出しを行い、切り出した文字画
像を認識してその候補となる文字コード列を出力するこ
とができる。
【0003】しかしながら、出力されたこれら文字コー
ド列の第一候補列は、読み取った画像と文字認識用辞書
から参照される文字パターンとの類似度を基準にして選
択、出力されるために、人間が読むと不自然な結果とな
ることが多かった。
【0004】そこで、文字認識後の処理として、出力さ
れた候補文字コード列に対して言語処理を行い、自然な
文字候補列に補正する試みが行われてきた。
【0005】これは、例えば、文字認識処理によって出
力される候補文字のすべての組み合わせを作成する。そ
して、これらの組み合わせに該当する単語を単語辞書か
ら検索し、単語辞書から検索された単語を取り出し言語
的に正しく組み合わせることによって、文字認識処理に
よって出力される文字候補列を、自然な文字候補列に補
正しようというものである。
【0006】
【発明が解決しようとする課題】しかしながら、上記従
来の文字認識装置の言語処理において、単語辞書に登録
されていない単語、即ち、未知語が読み取った原稿画像
に存在した場合、その未知語は、単語辞書に登録されて
いる単語のいずれかに該当するものとして検索されてし
まう。そのため、かえって文字認識結果を改悪してしま
うという問題が生じた。特に、この現象はカタカナや英
文字列で顕著である。例えば、「キリコ」という文字列
が含まれる原稿画像に対し文字認識処理し、第一候補文
字列に正しい文字認識結果「キリコ」が出力されたにも
かかわらず、この「キリコ」に対し言語処理を行うと、
文字認識結果が「千リラ」と改悪してしまうような場合
があった。
【0007】本発明は上記問題点に鑑みてなされたもの
であり、認識率を向上することができる文字認識装置及
びその方法を提供することを目的とする。
【0008】
【課題を解決するための手段】上記の目的を達成するた
めの本発明による文字認識装置は以下の構成を備える。
即ち、入力された画像データに対し文字認識を行う文字
認識装置であって、前記入力された画像データに対し文
字認識を行う文字認識手段と、前記文字認識手段によっ
て出力された候補文字列の各文字がひらがなあるいは漢
字であるか否かを判定する判定手段と、前記判定手段の
判定結果に基づいて、前記候補文字列から構成される部
分文字列に対し言語処理を行う言語処理手段とを備え
る。
【0009】また、好ましくは、前記判定手段は、前記
候補文字列中にひらがなあるいは漢字と判定されない連
続する部分文字列がある場合、該部分文字列を文字認識
結果として確定する。
【0010】また、好ましくは、前記言語処理手段は、
前記判定手段によってひらがなあるいは漢字と判定され
た文字群から構成される部分文字列に対し、言語処理を
行う。 また、好ましくは、前記言語処理手段は、前記
部分文字列に対応する単語が単語辞書に存在するか否か
を判定し、存在する場合は該単語を候補単語として抽出
し、存在しない場合は該部分文字列を文字認識結果とし
て確定する。
【0011】また、好ましくは、前記判定手段の実行の
有無を指定する指定手段を更に備える。
【0012】また、好ましくは、前記指定手段によって
前記判定手段の実行が指定されていない場合、前記言語
処理手段は、前記候補文字列から構成される部分文字列
に対し言語処理を行う。
【0013】上記の目的を達成するための本発明による
文字認識方法は以下の構成を備える。即ち、入力された
画像データに対し文字認識を行う文字認識方法であっ
て、前記入力された画像データに対し文字認識を行う文
字認識工程と、前記文字認識工程によって出力された候
補文字列の各文字がひらがなあるいは漢字であるか否か
を判定する判定工程と、前記判定工程の判定結果に基づ
いて、前記候補文字列から構成される部分文字列に対し
言語処理を行う言語処理工程とを備える。
【0014】上記の目的を達成するための本発明による
コンピュータ可読メモリは以下の構成を備える。即ち、
入力された画像データに対し文字認識を行う文字認識の
プログラムコードが格納されたコンピュータ可読メモリ
であって、前記入力された画像データに対し文字認識を
行う文字認識工程のプログラムコードと、前記文字認識
工程によって出力された候補文字列の各文字がひらがな
あるいは漢字であるか否かを判定する判定工程のプログ
ラムコードと、前記判定工程の判定結果に基づいて、前
記候補文字列から構成される部分文字列に対し言語処理
を行う言語処理工程のプログラムコードとを備える。
【0015】
【発明の実施の形態】以下、図面を参照して本発明の好
適な実施形態を詳細に説明する。
【0016】図1は本発明の実施形態の文字認識装置の
構成を示すブロック図である。
【0017】図1において、1はCPUであり、マイク
ロプロセッサから構成され、文字認識処理のための演
算、論理判断等を行う。また、PCIバス13を介し
て、PCIバス13に接続された各構成要素を制御す
る。
【0018】PCIバス13はCPU1の制御の対象と
する構成要素を指示するアドレス信号を転送する。ま
た、CPU1の制御の対象とする各構成要素のコントロ
ール信号を転送する。更に、各構成要素相互間のデータ
転送を行う。
【0019】次に、2はROMであり、読出し専用の固
定メモリである。ROM2に設けられているPA2a
は、図8〜図12のフローチャートで後述するCPU1
によって実行される制御の手順を記憶させたプログラム
エリアである。
【0020】また、3はRAMであり、書込み可能のラ
ンダムアクセスメモリであって、各構成要素からの各種
データの一時記憶に用いる。RAM3には、単語辞書W
DIC(3a)、接続規則辞書CDIC(3b)、文字
候補列バッファCBUF(3c)、未知語抽出モードU
MOD(3d)、単語情報WTB(3e)、文節候補情
報BCTB(3f)、形態素解析情報KTTB(3g)
が構成されている。
【0021】単語辞書WDIC(3a)は、かな漢字変
換を行うための単語の情報を格納したものであり、詳細
は図2を用いて後述する。接続規則辞書CDIC(3
b)は、形態素解析で用いられる句構造規則を格納した
辞書であり、詳細は図3を用いて後述する。
【0022】文字候補列バッファCBUF(3c)は、
言語処理の対象となる候補文字列を格納するバッファで
ある。言語処理は、このバッファに蓄えられた候補文字
列に対して、言語的に最適な認識結果文字列を求める。
文字候補列バッファCBUF(3c)の詳細は図4を用
いて後述する。未知語抽出モードUMOD(3d)は、
自然言語処理の際にひらがなや漢字以外の文字列を未知
語として扱うかどうかを示すフラグである。そして、こ
のフラグの値が1であれば、ひらがなや漢字以外の文字
列を未知語として扱い、これらの文字列に対して辞書検
索を行わないことを意味する。一方、このフラグの値が
0であれば、全ての文字に対して辞書検索を行うことを
意味する。この値には、通常は0がセットされる。
【0023】単語情報WTB(3e)は、形態素解析の
際に単語辞書から検索された単語、あるいは未知語とし
て抽出された単語を格納するテーブルであり、詳細は図
5を用いて後述する。文節候補情報BCTB(3f)
は、形態素解析の際に単語情報WTB(3e)に接続規
則辞書CDIC(3b)に記述されている接続規則を適
用することによって生成した文節候補を格納するテーブ
ルであり、詳細は図6を用いて後述する。形態素解析情
報KTTB(3g)は、形態素解析した結果求められた
形態素の情報を文節単位に格納するテーブルであり、詳
細は図7を用いて後述する。
【0024】6はINPUTC(入力コントローラ)で
あり、KB4やPD7から送られてくる入力信号は、I
NPUTC6によって適宜変換された後、PCIバス1
3を経由してCPU1に送信される。4はKB(キーボ
ード)であり、アルファベットキー、ひらがなキー、カ
タカナキー等の文字記号入力キー、及び、カーソル移動
を指示するカーソル移動キー等のような各種のファンク
ションキーを備えている。ファンクションキーとして
は、MODE(4b)とSTART(4a)を備えてい
る。
【0025】MODE(4b)は、文字認識後の自然言
語処理の際、カタカナや英文字列を必ず未知語として扱
うかどうかのモードを切り替えるキーである。また、S
TART(4a)は、本発明の文字処理装置において文
字認識処理の起動を指示するキーである。
【0026】7はマウスやトラックボールなどのPD
(ポインティングデバイス)であり、表示画面上のカー
ソルやボタンなどを指示するために使用される。5はD
ISKであり、文書データ等のデータを記憶するための
外部メモリである。DISK5には、文書データ等のデ
ータが必要に応じて保管され、また、保管されたデータ
はKB4の指示により必要な時にDISK5から呼び出
される。
【0027】11はVIDEO(ビデオコントローラ)
であり、PCIバス13を介して表示用のデータがここ
に蓄えられるとともに、表示用の信号に変換されてDI
SP12に出力される。12はDISP(表示装置)で
あり、陰極線官や液晶などが用いられ、各種処理の結果
や装置の状態、ユーザに対するメッセージなどを表示す
る。8はDEVC(デバイスコントローラ)であり、P
CIバス13を介して伝達されるCPU1の指示によっ
て、自身に接続されている機器を制御する。また、自身
に接続されている機器が出力する信号やデータをPCI
バス13を介してCPU1やDISK5に適宜伝達す
る。
【0028】9はSCAN(スキャナー)であり、DE
VC8からの指示によって、セットされた原稿を光学的
な方法によって原稿画像を読み取り、DEVC8に出力
する。10はNI(ネットワークインタフェース)であ
り、本発明の文字認識システムをLANやインターネッ
ト等のNETWORK14を経由して外部のシステムと
接続するための機器である。この接続を経由して、本発
明の文字認識システムは、信号やデータを外部のシステ
ムと送受信することが可能である。
【0029】以上の各構成要素からなる本発明文字処理
装置においては、KB4やPD7からの各種の入力に応
じて作動するものであり、KB4やPD7からの入力が
供給されると、INPUTC6を経由して、インタラプ
ト信号がCPU1に送られる。そして、そのCPU1が
ROM2内に記憶してある各種の制御信号を読出し、そ
れらの制御信号に従って、各種の制御が行なわれる。
【0030】次に、本実施形態の単語辞書WDIC(3
a)の構成について、図2を用いて説明する。
【0031】図2は本発明の実施形態の単語辞書WDI
Cの構成の一例を示す図である。
【0032】単語辞書WDIC(3a)には、1つの単
語の情報として、読みと表記と品詞と単語IDが格納さ
れる。単語IDは他の単語と区別し、単語IDによって
その単語を指し示すことができるようにつけられたユニ
ークな番号である。各単語の情報は読みによってソート
されて格納されているが、本実施形態における単語辞書
WDIC(3a)は表記によって検索することが可能で
ある。
【0033】次に、本実施形態の接続規則辞書CDIC
(3b)の構成について、図3を用いて説明する。
【0034】図3は本発明の実施形態の接続規則辞書C
DICの構成の一例を示す図である。
【0035】接続規則とは、文節内で接続が可能な2つ
の単語の品詞の組み合わせを示したものであり、接続規
則辞書CDIC(3b)には、その接続規則から構成さ
れる。尚、接続規則は、後述する形態素解析において用
いられる。図中において、「+」は、文節を構成する要
素が、要素が並ぶ順番通りに無条件に結合して文節を構
成できることを意味している。例えば、図中の規則の一
つ(rule1)は、「名詞」と「助詞(の)」がこの
順番に出現すれば、結合して文節になれることを示して
いる。
【0036】次に、本実施形態の文字候補列バッファC
BUF(3c)の構成について、図4を用いて説明す
る。
【0037】図4は本発明の実施形態の文字候補列バッ
ファCBUFの構成の一例を示す図である。
【0038】文字候補列バッファCBUF(3c)に
は、SCAN9で読み取られた原稿画像を文字単位で切
り出し、切り出された文字画像を画像解析により認識し
た結果として出力される文字候補列が、文字コードに変
換されて格納される。本実施形態では、各文字の第一候
補が文字候補列バッファCBUF(3c)の先頭行に格
納され、以下の行には、列毎に各文字の候補が格納され
る。尚、図4の上に記載した番号は画像処理によって切
り出された文字の順番と数を示している。
【0039】図4では、「画家のキリコの回顧展を見に
行った。」という文字列を文字認識したときの文字候補
列バッファCBUF(3c)に格納された文字列の例を
示している。そして、図4に示すように、画像解析によ
る第一候補文字列は「画衆のキリコの回顔民を見に符っ
た。」である。また、原稿の先頭文字「画」に対する文
字候補は、「画」「向」「巴」「凸」「畠」である。
【0040】次に、本実施形態の単語情報WTB(3
e)の構成について、図5を用いて説明する。
【0041】図5は本発明の実施形態の単語情報WTB
の構成の一例を示す図である。
【0042】単語情報WTB(3e)には、文字候補列
バッファCBUF(3c)の各文字の組み合わせに一致
する単語を検索した結果が納められる。例えば、図4に
図示した文字候補列の場合、「画衆の」「画家の」「画
朱の」「画宋の」など、各列毎に文字候補から1文字だ
けを取り出して、連続した文字列を作成し、これらの全
てに対して表記が一致する単語を検索した結果を格納す
る。そして、図5に示すように、1つの単語情報WTB
(3e)には、文字開始位置、文字終了位置、表記、品
詞、単語IDから構成される。文字開始位置と文字終了
位置は、この単語の表記と一致する文字候補列バッファ
CBUF(3c)の文字列先頭からの位置が納められて
いる。図5では、表記が「画家」である単語は文字候補
列バッファCBUF(3c)内の1番目から2番目の文
字候補列にマッチングしていることがわかる。また、図
5は、図4の文字候補列バッファCBUF(3c)に格
納されている全ての文字列候補の組み合わせに対して、
単語辞書WDIC(3a)とマッチングを行った場合の
単語情報WTB(3e)の例である。
【0043】次に、本実施形態の文節候補情報BCTB
(3f)の構成について、図6を用いて説明する。
【0044】図6は本発明の実施形態の文節候補情報B
CTBの構成の一例を示す図である。
【0045】文節候補情報BCTB(3f)には、単語
情報WTB(3e)に接続規則辞書CDIC(3b)に
記述されている接続規則を適用した結果が納められる。
図示したように、1つの文節候補情報BCTB(3f)
は、文字開始位置、文字終了位置、表記、文節を構成す
る単語から構成される。文字開始位置と文字終了位置に
は、単語情報WTB(3e)と同じく対応する文字候補
列バッファCBUF(3c)中の文字候補の先頭からの
位置が納められる。図中,先頭の文節候補は、文字候補
列バッファの1番目から3番目の文字候補の組み合わせ
の一つであり、名詞<画家>と助詞(の)から構成され
ている。図中で「φ」が格納されている欄は、情報が存
在しないことを意味する。図6は、図4の文字候補列バ
ッファCBUF(3c)に対して、全ての文字候補の組
み合わせに対して単語辞書WDIC(3a)とマッチン
グを行った時の、文節候補情報BCTB(3f)の例で
ある。
【0046】次に、本実施形態の形態素解析情報KTT
B(3g)の構成について、図7を用いて説明する。
【0047】図7は本発明の実施形態の形態素解析情報
KTTBの構成の一例を示す図である。
【0048】形態素解析情報KTTB(3g)は、文節
番号と、文節の表記と、文節を構成する単語を対応させ
て、形態素解析の結果、解析された文字候補列を文節単
位として管理している。図中において、文節番号が3の
文節の表記は、「回顧展を」であり、その文節は、名詞
<回顧>と名詞<展>と助詞(を)から構成されている
ことを示している。文節番号は、最初に作成された文節
から順番に番号がふられる。図中で「φ」が格納されて
いる欄は、情報が存在しないことを意味する。図7は、
図4の文字候補列バッファCBUF(3c)に対して、
全ての文字候補の組み合わせに対して単語辞書WDIC
(3a)とマッチングを行った場合の形態素解析情報K
TTB(3g)の例である。
【0049】次に、本実施形態のPA(2a)に格納さ
れた手順によって実行される制御について、図8〜図1
2を用いて説明する。
【0050】まず、本実施形態で実行される制御の概要
について、図8のフローチャートを用いて説明する。
【0051】図8は本発明の実施形態で実行される制御
の概要を示すフローチャートである。
【0052】まず、ステップS1で、KB4から入力さ
れるデータを取り込む処理を行う。ステップS2で、取
り込まれたデータによって入力に用いられたキーの種類
を判定し、各キーの処理ルーチンに分岐する。MODE
キー(4b)による入力が行われた場合には、ステップ
S3に分岐し、言語処理においてひらがなと漢字以外の
文字列を必ず未知語として取り扱うかどうかの切替を行
う。ひらがなと漢字以外の文字列を必ず未知語として取
り扱うモードであれば取り扱わないモードに、未知語と
して取り扱わないモードであれば取り扱うモードに切り
替える。すなわち、UMODの値を調べ、1であれば0
に、0であれば1に切り替える。切り替えを行った後、
ステップS6へ進む。
【0053】また、STARTキー(4a)による入力
が行われた場合には、ステップS4に分岐し、文字認識
処理が処理される。尚、文字認識処理については、図9
において詳述する。そして、文字認識処理が行われた
後、ステップS6へ進む。
【0054】また、上記キー以外のキーによるその他の
入力が行われた場合には、ステップS5に分岐し、文字
入力や挿入、削除、ウィンドウ操作などの通常の文字認
識装置において行われるその他の処理が行われる。これ
らの処理は同種の文字認識装置において一般に行われる
処理であり、公知であるので特に記述しない。処理が行
われた後、ステップS6へ進む。
【0055】ステップS6で、上述の処理の結果、変更
された部分を表示する表示処理を行う。つまり、文書中
のデータ一文字を読むごとにそれを文字パターンに展開
し、表示バッファに出力するというように通常一般的に
行われている処理である。処理を終えると、ステップS
1に戻る。
【0056】次に、図8のフローチャートのステップS
4の文字認識処理の詳細について、図9を用いて説明す
る。
【0057】図9は本発明の実施形態の図8のフローチ
ャートのステップS4の文字認識処理の詳細を示すフロ
ーチャートである。
【0058】まず、ステップS11で、SCAN9で原
稿画像を読み取り、読み取った原稿画像を表示バッファ
やDISK5などに出力する原稿読み取り処理を行う。
この種の処理は同種の文字認識装置において、一般に行
なわれている処理であり、公知であるので特に記述しな
い。処理が行なわれた後、ステップS12へ進む。
【0059】ステップS12で、読み取った原稿画像に
対してレイアウト認識と領域抽出を行う。そして、レイ
アウト認識によって認識された文字領域に対して個々の
文字の画像を切り出す文字切りだし処理を行う。この種
の処理は同種の文字認識装置において一般に行なわれて
いる処理であり、公知であるので特に記述しない。処理
が行なわれた後、ステップS13へ進む。
【0060】ステップS13で、切り出された文字画像
を認識して、文字候補列コードを文字候補バッファCB
UF(3c)に出力する文字候補出力処理を行う。この
種の処理は同種の文字認識装置において一般に行なわれ
ている処理であり、公知であるので特に記述しない。処
理が行なわれた後、ステップS14へ進む。
【0061】ステップS14で、文字候補列バッファC
BUF(3c)に出力された文字候補列に対して、言語
処理によって認識結果を補正し、言語的に妥当な認識結
果を作成する言語補正処理を行う。尚、言語補正処理に
ついては、図10において詳述する。処理が行なわれた
後、文字認識処理を終了する。
【0062】次に、図9のフローチャートのステップS
14の言語補正処理の詳細について、図10を用いて説
明する。
【0063】図10は本発明の実施形態の図9のフロー
チャートのステップS14の言語補正処理の詳細を示す
フローチャートである。
【0064】まず、ステップS21で、文字候補列バッ
ファCBUF(3c)に格納された文字候補列に対し
て、単語辞書WDIC(3a)を参照しながら、形態素
解析を行う形態素解析処理を行う。尚、本実施形態にお
ける形態素解析は、二文節最長一致法による。二文節最
長一致法とは、形態素解析後の隣接する任意の二文節に
対応する読みの長さが最長になる文節の区切りを採用す
る方法である。こうして区切られた文節列を出力する。
その後、解釈可能な文節と、文節の構造を明らかにし、
その結果を形態素解析情報KTTB(3g)に追加す
る。また、形態素解析処理については、図11において
後述する。
【0065】ステップS22で、形態素解析情報KTT
B(3g)を参照しながら、構文解析を行う構文解析処
理を行う。形態素解析情報KTTB(3g)から、文節
の候補を各文節番号に対して1つずつ選び出し、構文規
則に基づいて句を生成していき、構文解析を行い、最終
的に文が生成できれば、構文解析に成功したものとみな
す。このような構文解析の方法は、構文解析手法として
一般的に行われており、公知であるので特に記述しな
い。構文解析に成功した場合は、ステップS23へ進
む。また、構文解析に失敗した場合は、形態素解析情報
KTTB(3g)中の文節の候補を変更して構文解析を
行う。また、すべての文節の候補に対して構文解析に失
敗した場合は、ステップS23に進む。
【0066】ステップS23で、形態素解析及び構文解
析によって解析された結果に基づいて、最適な文字候補
を決定する文字候補決定処理を行う。ステップS22に
おいて構文解析に成功していれば、成功した構文解析で
使用している文節の候補の表記を最適な文字候補として
決定する。構文解析に成功したものがなければ、ステッ
プS21の形態素解析のみで、最適な文字候補を決定す
る。文字候補決定処理を終えた後、ステップS24へ進
む。
【0067】ステップS24で、決定された最適な文字
候補を表示する補正結果表示処理を行う。これは、例え
ば、言語処理によって画像認識結果の第一候補が入れ替
えられた場合、その文字だけを別の属性で表示するなど
の処理である。この種の処理は公知であるので特に記述
しない。補正結果表示処理を終えた後、言語補正処理を
終了する。
【0068】次に、図10のフローチャートのステップ
S21の形態素解析処理の詳細について、図11を用い
て説明する。
【0069】図11は本発明の実施形態の図10のフロ
ーチャートのステップS21の形態素解析処理の詳細を
示すフローチャートである。
【0070】まず、ステップS31で、文字候補列バッ
ファCBUF(3c)に格納された文字候補列のすべて
の部分文字列の組み合わせに対して、単語辞書WDIC
(3a)を検索し、表記が部分文字列にマッチする単語
の各情報を単語情報WTB(3e)に格納する単語抽出
処理を行う。尚、単語抽出処理については、図12を用
いて詳述する。処理を終えた後、ステップS32に進
む。
【0071】ステップS32で、作成された単語情報W
TB(3e)に、接続規則辞書CDIC(3b)に記述
されている接続規則を適用し、文節候補情報BCTB
(3f)を作成する処理を行う。文節候補の作成とは、
生成された文節の表記が必ず文字候補列バッファCBU
F(3c)に格納されている文字候補列の部分列とマッ
チするように各単語に接続規則を適用することである。
これにより、すべての文節候補を作成した後、ステップ
S33に進む。
【0072】ステップS33で、文節候補情報BCTB
(3f)を参照して、最終的な文節を決定し、形態素解
析情報KTTB(3g)を作成する文節の決定処理を行
う。文節を決定する際において用いられる手法は前述し
た二文節最長一致法である。処理を終えると、形態素解
析処理を終了する。
【0073】次に、図11のフローチャートのステップ
S31の単語抽出処理の詳細について、図12を用いて
説明する。
【0074】図12は本発明の実施形態の図11のフロ
ーチャートのステップS31の単語抽出処理の詳細を示
すフローチャートである。
【0075】まず、ステップS41で、文字候補列バッ
ファCBUF(3c)に格納された文字候補列の1行
目、すなわち、画像認識による第一候補として選択され
た文字候補の文字種をチェックする。文字種がひらがな
や漢字の場合は、ステップS42へ進む。一方、文字種
がカタカナや英数字の場合は、ステップS44へ進む。
ステップS42で、文字候補バッファCBUF(3b)
に格納された文字候補列のあらゆる組み合わせにおいて
すべての部分文字列を作成し、それら部分文字列と同じ
表記を持つ単語が単語辞書WDIC(3a)に存在する
かどうかを調べる候補文字部分列検索処理を行う。この
種の辞書検索方法は、この種の言語処理において一般的
であり、公知なので特に詳述しない。すべての候補文字
部分列に対して検索を終えた後、ステップS43へ進
む。
【0076】ステップS43で、候補文字部分列検索処
理を行った結果、ある位置の文字候補に対して単語が抽
出できたかどうかをチェックする検索チェック処理を行
う。ある位置の文字候補に対応する単語が一つでも見つ
かった場合は、ステップS46に進む。一方、ある位置
の文字候補に対応する単語がまったく見つからなかった
場合は、ステップS45に進む。
【0077】一方、ステップS41において、文字種が
カタカナや英数字の場合は、ステップS44で、未知語
抽出モードUMODの値をチェックするUMODチェッ
ク処理を行う。UMODが1のとき、すなわち、カタカ
ナや英文字を必ず未知語として抽出する場合は、ステッ
プS45へ進む。一方、UMODが0のときは、ステッ
プS42ヘ進む。
【0078】ステップS45で、未知語、すなわち、辞
書に記載されていない単語を抽出する未知語抽出処理を
行う。未知語抽出処理は、例えば、ひらがな、カタカ
ナ、英字などの字種が連続している部分を抽出して、名
詞とみなす処理であり、かな漢字変換のような言語処理
では一般に行われている処理である。本発明における未
知語処理では、未知語として抽出される文字候補は全て
画像認識において第一候補である文字候補のみを抽出す
る。即ち、いったん未知語抽出処理が起動されると、文
字候補列バッファCBUF(3b)の第一列において、
起動された文字位置から同種の文字種が連続する部分を
抽出して単語とみなし、その品詞を名詞とする。未知語
抽出処理を終えると、ステップS46へ進む。
【0079】ステップS46で、上述した処理で辞書か
ら検索された単語、あるいは未知語として抽出された単
語を単語情報WTB(3e)に格納する単語情報格納処
理を行う。単語情報格納処理を終えると、ステップS4
7へ進む。ステップS47で、文字候補列バッファCB
UF(3c)に格納されている文字候補列の末尾まで単
語抽出できたかどうかをチェックする候補文字列終了チ
ェックを行う。まだ、単語抽出が文字候補列バッファC
BUF(3c)の末尾まで達していなければ、ステップ
S41に戻る。一方、文字候補列バッファCBUF(3
c)の末尾まで単語抽出が終了していれば、単語抽出処
理を終了する。
【0080】次に、本実施形態の具体例として、「画家
のキリコの回顧展を見に行った」という文字列を画像認
識した結果、文字候補列バッファCBUF(3c)に図
4に示した文字候補列が格納されている状態において、
言語補正処理を行う様子を、ひらがな、漢字以外の文字
列を必ず未知語として扱う場合と、未知語として扱わな
い場合に分けて、図11のフローチャートに沿って説明
していく。尚、単語辞書WDIC(3a)には、図2に
図示したように表記が「キリコ」である単語は存在しな
いものとする。
【0081】ひらがな、漢字以外の文字列を未知語とし
て扱わない場合、ステップS31の単語抽出処理によっ
て生成される単語情報WTB(3e)は図5のようにな
る。この場合、単語抽出処理において、画像認識による
第一候補がどんな文字種であっても必ず辞書検索されて
しまうために、図4の文字位置4を先頭とする単語
「千」と「十」が抽出される。また、文字位置5を先頭
とする単語「リラ」が抽出される。従って、文字位置4
を先頭とする未知語「キリコ」は抽出されず、図5に図
示したように単語情報WTB(3e)に「キリコ」とい
う表記を持つ単語は現れない。
【0082】次に、ステップS32の文節候補作成処理
において、ステップS31で生成された単語情報WTB
(3e)中の単語に図3で示した接続規則を適用し、図
6に示した文節候補情報BCTB(3f)が作成され
る。例えば、図5の先頭の単語「画家」に図3の(ru
le1)「名詞+(の)」を適用することにより、図6
の先頭の文節候補「名詞<画家>+助詞<の>」が得ら
れるが、この文節候補は、文字候補列バッファの1番目
から3番目までの文字候補列に相当する。
【0083】次に、ステップS33の文節の決定処理に
おいて、ステップS32で作成された文節候補の組み合
わせのうち、二文節最長一致法によって最も妥当な組み
合わせが選択決定され、形態素解析情報KTTB(3
g)が作成される。図6に示した文節候補によれば、文
節候補の可能な組み合わせの先頭の二文節の候補とし
て、「画家の・千リラの」と「画家の・千リラ」と「画
家の・千」等が作成されるが、このうち、表記が最も長
い「画家の・千リラの」がまず最適な組み合わせとして
決定される。以下、「千リラの・回顧展を」、「回顧展
を・見に行った。」という文節候補の組み合わせが同様
にして決定され、図7に示す形態素解析情報KTTB
(3g)が得られる。
【0084】一方、ひらがな、漢字以外の文字列を必ず
未知語として抽出する場合、ステップS31の単語抽出
処理によって生成される単語情報WTB(3e)は図1
3のようになる。この場合、文字候補列バッファCBU
F(3c)に格納されている文字候補列の第一候補がカ
タカナであるときは、かならず未知語として抽出され
る。そのため、図13に示すように、未知語「キリコ」
が抽出されて単語情報WTB(3e)に名詞として格納
される。
【0085】次に、ステップS32の文節候補作成処理
において、ステップS31で生成された単語情報WTB
(3e)中の単語に図13で示した接続規則を適用し、
図14に示した文節候補情報BCTB(3f)が作成さ
れる。
【0086】次に、ステップS33の文節の決定処理に
おいて、ステップS32で作成された文節候補の組み合
わせのうち、二文節最長一致法によって最も妥当な組み
合わせが選択決定され、形態素解析情報KTTB(3
g)が作成される。図14に示した文節候補によれば、
文節候補の可能な組み合わせの先頭の二文節の候補とし
て、「画家の・キリコの」や「画家の・キリコ」等が作
成される。このうち、表記が最も長い「画家の・キリコ
の」が、まず最適な組み合わせとして決定される。以
下、「キリコの・回顧展を」「回顧展を・見に行っ
た。」という文節候補の組み合わせが同様にして決定さ
れ、図16に示す形態素解析情報KTTB(3g)が得
られる。即ち、ひらがな、漢字以外の文字が第一候補で
ある文字候補列に対して、言語処理における辞書検索を
行わないようにすることで、正しい認識結果である「画
家のキリコの回顧展を見に行った。」を得ることができ
る。
【0087】以上説明したように、本実施形態では、ひ
らがな、漢字以外の文字が第一候補である文字候補列に
対して、辞書検索を行わないようにすることで、単語情
報WTB(3e)を作成する時点で、未知語の可能性が
高いカタカナや英文字列を未知語として画像認識の結果
をそのまま抽出することにより、画像認識後の自然言語
処理による悪影響を避けながら、認識率を高めることが
できる。
【0088】また、ユーザにひらがな、漢字以外の文字
が第一候補である文字候補列を必ず未知語として扱うか
どうかを選択させることにより、カタカナや英字文字列
が単語として辞書に登録されていることがあらかじめわ
かっている場合は、カタカナや英字文字列に対しても辞
書検索を行って、認識後の言語補正を行うことも可能に
なる。
【0089】尚、本発明は上述した実施形態に限定され
るものではない。上述の実施形態では、文字認識装置の
各種構成要素を接続するバスとしてPCIバス13を採
用しているが、ISAバスやVLバスなどでもまったく
同様な文字認識装置を構成することが可能である。
【0090】また、上述の実施形態では、文字認識処理
において、SCAN9から読み込んだ原稿画像に対して
各処理を行っているが、DISK5に格納済みの原稿画
像や、NI10を経由して外部システムから取り込んだ
原稿画像に対しても同様な処理を行うことが可能であ
る。
【0091】また、上述の実施形態では、文節を決定す
る際に二文節最長一致法をとっているが、これに限定さ
れるものではない。例えば、文節数最小法や接続コスト
最小法などの他の手法を用いることも可能である。
【0092】また、上述の実施形態では、単語抽出処理
の際、文字候補列バッファCBUF(3c)中の第一文
字候補文字の文字種チェックを行ってから、ひらがな、
漢字以外の文字の場合に対してUMODチェック処理を
行っているが、UMODチェック処理を先に行った後、
UMODが1の場合にのみ第一候補文字種チェックを行
っても同様の効果を得ることが可能である。
【0093】その他、本発明はその要旨を逸脱しない範
囲で種種変形して実施することができる。
【0094】尚、本発明は、複数の機器(例えば、ホス
トコンピュータ、インタフェース機器、リーダ、プリン
タなど)から構成されるシステムに適用しても、一つの
機器からなる装置(例えば、複写機、ファクシミリ装置
など)に適用してもよい。
【0095】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体を、システムあるいは装置に供給し、そ
のシステムあるいは装置のコンピュータ(またはCPU
やMPU)が記憶媒体に格納されたプログラムコードを
読出し実行することによっても、達成されることは言う
までもない。
【0096】この場合、記憶媒体から読出されたプログ
ラムコード自体が前述した実施形態の機能を実現するこ
とになり、そのプログラムコードを記憶した記憶媒体は
本発明を構成することになる。
【0097】プログラムコードを供給するための記憶媒
体としては、例えば、フロッピディスク、ハードディス
ク、光ディスク、光磁気ディスク、CD−ROM、CD
−R、磁気テープ、不揮発性のメモリカード、ROMな
どを用いることができる。
【0098】また、コンピュータが読出したプログラム
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているOS(オペレ
ーティングシステム)などが実際の処理の一部または全
部を行い、その処理によって前述した実施形態の機能が
実現される場合も含まれることは言うまでもない。
【0099】更に、記憶媒体から読出されたプログラム
コードが、コンピュータに挿入された機能拡張ボードや
コンピュータに接続された機能拡張ユニットに備わるメ
モリに書込まれた後、そのプログラムコードの指示に基
づき、その機能拡張ボードや機能拡張ユニットに備わる
CPUなどが実際の処理の一部または全部を行い、その
処理によって前述した実施形態の機能が実現される場合
も含まれることは言うまでもない。
【0100】
【発明の効果】以上説明したように、本発明によれば、
認識率を向上することができる文字認識装置及びその方
法を提供できる。
【0101】
【図面の簡単な説明】
【図1】本発明の実施形態の文字認識装置の構成を示す
ブロック図である。
【図2】本発明の実施形態の単語辞書WDICの構成の
一例を示す図である。
【図3】本発明の実施形態の接続規則辞書CDICの構
成の一例を示す図である。
【図4】本発明の実施形態の文字候補列バッファCBU
Fの構成の一例を示す図である。
【図5】本発明の実施形態の単語情報WTBの構成の一
例を示す図である。
【図6】本発明の実施形態の文節候補情報BCTBの構
成の一例を示す図である。
【図7】本発明の実施形態の形態素解析情報KTTBの
構成の一例を示す図である。
【図8】本発明の実施形態で実行される制御の概要を示
すフローチャートである。
【図9】本発明の実施形態の図8のフローチャートのス
テップS4の文字認識処理の詳細を示すフローチャート
である。
【図10】本発明の実施形態の図9のフローチャートの
ステップS14の言語補正処理の詳細を示すフローチャ
ートである。
【図11】本発明の実施形態の図10のフローチャート
のステップS21の形態素解析処理の詳細を示すフロー
チャートである。
【図12】本発明の実施形態の図11のフローチャート
のステップS31の単語抽出処理の詳細を示すフローチ
ャートである。
【図13】本発明の実施形態の単語情報WTBの構成の
一例を示す図である。
【図14】本発明の実施形態の文節候補情報BCTBの
構成の一例を示す図である。
【図15】本発明の実施形態の形態素解析情報KTTB
の構成の一例を示す図である。
【符号の説明】
1 CPU 2 ROM 3 RAM 3a 単語辞書(WDIC) 3b 接続規則辞書(CDIC) 3c 文字候補列バッファ(CBUF) 3d 未知語抽出モード(UMOD) 3e 単語情報(WTB) 3f 文節候補情報(BCTB) 3g 形態素解析情報(KTTB) 4 キーボード(KB) 4a スタートキー(STARAT) 4b モードキー(MODE) 5 外部メモリ(DISK) 6 入力コントローラ(INPUTC) 7 ポインティングデバイス(PD) 8 デバイスコントローラ(DEVC) 9 スキャナ(SCAN) 10 ネットワークインタフェース(NI) 11 ビデオコントローラ(VIDEO) 12 表示装置(DISP) 13 PCIバス 14 NETWORK

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 入力された画像データに対し文字認識を
    行う文字認識装置であって、 前記入力された画像データに対し文字認識を行う文字認
    識手段と、 前記文字認識手段によって出力された候補文字列の各文
    字がひらがなあるいは漢字であるか否かを判定する判定
    手段と、 前記判定手段の判定結果に基づいて、前記候補文字列か
    ら構成される部分文字列に対し言語処理を行う言語処理
    手段とを備えることを特徴とする文字認識装置。
  2. 【請求項2】 前記判定手段は、前記候補文字列中にひ
    らがなあるいは漢字と判定されない連続する部分文字列
    がある場合、該部分文字列を文字認識結果として確定す
    ることを特徴とする請求項1に記載の文字認識装置。
  3. 【請求項3】 前記言語処理手段は、前記判定手段によ
    ってひらがなあるいは漢字と判定された文字群から構成
    される部分文字列に対し、言語処理を行うことを特徴と
    する請求項1に記載の文字認識装置。
  4. 【請求項4】 前記言語処理手段は、前記部分文字列に
    対応する単語が単語辞書に存在するか否かを判定し、存
    在する場合は該単語を候補単語として抽出し、存在しな
    い場合は該部分文字列を文字認識結果として確定するこ
    とを特徴とする請求項1に記載の文字認識装置。
  5. 【請求項5】 前記判定手段の実行の有無を指定する指
    定手段を更に備えることを特徴とする請求項1に記載の
    文字認識装置。
  6. 【請求項6】 前記指定手段によって前記判定手段の実
    行が指定されていない場合、前記言語処理手段は、前記
    候補文字列から構成される部分文字列に対し言語処理を
    行うことを特徴とする請求項5に記載の文字認識装置。
  7. 【請求項7】 入力された画像データに対し文字認識を
    行う文字認識方法であって、 前記入力された画像データに対し文字認識を行う文字認
    識工程と、 前記文字認識工程によって出力された候補文字列の各文
    字がひらがなあるいは漢字であるか否かを判定する判定
    工程と、 前記判定工程の判定結果に基づいて、前記候補文字列か
    ら構成される部分文字列に対し言語処理を行う言語処理
    工程とを備えることを特徴とする文字認識方法。
  8. 【請求項8】 前記判定工程は、前記候補文字列中にひ
    らがなあるいは漢字と判定されない連続する部分文字列
    がある場合、該部分文字列を文字認識結果として確定す
    ることを特徴とする請求項7に記載の文字認識方法。
  9. 【請求項9】 前記言語処理工程は、前記判定工程によ
    ってひらがなあるいは漢字と判定された文字群から構成
    される部分文字列に対し、言語処理を行うことを特徴と
    する請求項7に記載の文字認識方法。
  10. 【請求項10】 前記言語処理工程は、前記部分文字列
    に対応する単語が単語辞書に存在するか否かを判定し、
    存在する場合は該単語を候補単語として抽出し、存在し
    ない場合は該部分文字列を文字認識結果として確定する
    ことを特徴とする請求項7に記載の文字認識方法。
  11. 【請求項11】 前記判定工程の実行の有無を指定する
    指定工程を更に備えることを特徴とする請求項7に記載
    の文字認識方法。
  12. 【請求項12】 前記指定工程によって前記判定工程の
    実行が指定されていない場合、前記言語処理工程は、前
    記候補文字列から構成される部分文字列に対し言語処理
    を行うことを特徴とする請求項11に記載の文字認識方
    法。
  13. 【請求項13】 入力された画像データに対し文字認識
    を行う文字認識のプログラムコードが格納されたコンピ
    ュータ可読メモリであって、 前記入力された画像データに対し文字認識を行う文字認
    識工程のプログラムコードと、 前記文字認識工程によって出力された候補文字列の各文
    字がひらがなあるいは漢字であるか否かを判定する判定
    工程のプログラムコードと、 前記判定工程の判定結果に基づいて、前記候補文字列か
    ら構成される部分文字列に対し言語処理を行う言語処理
    工程のプログラムコードとを備えることを特徴とするコ
    ンピュータ可読メモリ。
JP9286992A 1997-10-20 1997-10-20 文字認識装置及びその方法、コンピュータ可読メモリ Withdrawn JPH11120290A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9286992A JPH11120290A (ja) 1997-10-20 1997-10-20 文字認識装置及びその方法、コンピュータ可読メモリ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9286992A JPH11120290A (ja) 1997-10-20 1997-10-20 文字認識装置及びその方法、コンピュータ可読メモリ

Publications (1)

Publication Number Publication Date
JPH11120290A true JPH11120290A (ja) 1999-04-30

Family

ID=17711625

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9286992A Withdrawn JPH11120290A (ja) 1997-10-20 1997-10-20 文字認識装置及びその方法、コンピュータ可読メモリ

Country Status (1)

Country Link
JP (1) JPH11120290A (ja)

Similar Documents

Publication Publication Date Title
US9251294B2 (en) Method and system for approximate string matching
US5890103A (en) Method and apparatus for improved tokenization of natural language text
US7802184B1 (en) Method and apparatus for processing text and character data
US7305382B2 (en) Information searching apparatus and method, information searching program, and storage medium storing the information searching program
JPH1153384A (ja) キーワード抽出装置及びキーワード抽出方法並びにキーワード抽出プログラムを格納したコンピュータ読み取り可能な記録媒体
JP2006343870A (ja) 文書検索装置及び方法と記憶媒体
JP2806452B2 (ja) かな漢字変換装置および方法、並びに記録媒体
JPH11120290A (ja) 文字認識装置及びその方法、コンピュータ可読メモリ
JPH09198404A (ja) 文書処理方法及び装置
JPH09153034A (ja) 文書作成装置及び文書作成方法
JPH10283368A (ja) 情報処理装置及びその方法
JP2621999B2 (ja) 文書処理装置
JP3847869B2 (ja) 文字列変換装置及び方法
JPH10187697A (ja) 文字処理装置及びその方法
JP2003178263A (ja) 文字認識装置及び記録媒体
JP2833650B2 (ja) 文書処理装置
JPH10198664A (ja) 日本語入力システム及び日本語入力プログラムを記録した媒体
JP3344793B2 (ja) かな漢字変換装置
JPH10307839A (ja) テキスト検索装置及び方法
JP4255253B2 (ja) 文書検索システム及び方法
JP2000148747A (ja) 変換候補表示方法,およびこの方法によるかな漢字変換用のプログラムの記録媒体ならびにかな漢字変換装置
JPH05282293A (ja) 文書作成装置
JPH11212976A (ja) 形態素解析装置
JPH11338978A (ja) 文字認識装置、方法および記憶媒体
JP2001005814A (ja) 辞書作成装置、辞書作成方法、辞書作成プログラムを記録したコンピュータで読取可能な記録媒体および翻訳装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050104