JPH0242578A - 機械図面自動認識方法 - Google Patents

機械図面自動認識方法

Info

Publication number
JPH0242578A
JPH0242578A JP63193955A JP19395588A JPH0242578A JP H0242578 A JPH0242578 A JP H0242578A JP 63193955 A JP63193955 A JP 63193955A JP 19395588 A JP19395588 A JP 19395588A JP H0242578 A JPH0242578 A JP H0242578A
Authority
JP
Japan
Prior art keywords
character
character string
information
dictionary
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63193955A
Other languages
English (en)
Inventor
Yasuyuki Numata
泰之 沼田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP63193955A priority Critical patent/JPH0242578A/ja
Publication of JPH0242578A publication Critical patent/JPH0242578A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、機械図面自動認識方法に関する。
従来の技術 機械図面の自動認識においては、図面中に存在する文字
列を自動的に解釈することは必要不可欠である。
この点、従来の機械図面自動認識に関する各種論文等を
見ても、図面中から文字列を抽出し、個々の文字を認識
することにより、文字列の解釈を行う、といった程度の
開示しかなされていないものである。
発明が解決しようとする問題点 ところが、このような方法により、特に文字列中におけ
る文字の位置を考慮せずに、単一の辞書による文字認識
を行った場合、得られた結果を解釈するためには、改め
て機械図面中の文字列の特徴を考慮した解析を行う必要
がある。
例えば、ある文字列の文字認識の結果が、[M−54C
J といったように得られる場合も、文字認識の性能に
よっては、十分考えられる。もちろん、個々の文字認識
の結果を保持しておけば、再び文字認識を行うといった
必要性はなくなるが、何れにしても、このような結果に
対して、解析を試みるには、ある程度複雑なロジックが
必要と思われる。
つまり、従来方法による場合、文字列抽出後の文字列を
構成する文字認識においては、特徴量の似通った文字の
場合に誤認識を生じやすい。
問題点を解決するための手段 図面を画像情報として読込む画像情報入力手段と、読込
まれた画像情報を記憶する画像情報記憶手段と、読込ん
だ画像情報中から文字のイメージとその位置とを抽出す
る文字情報抽出手段と、抽出された個々の文字に関する
イメージ情報や位置情報などの文字情報を記憶する文字
情報記憶手段と、記憶された文字情報に基づき1文字単
位に文字認識を行う文字認識手段と、認識された個々の
文字の位置情報に基づいて文字列を抽出する文字列抽出
手段と、抽出された各々の文字列を構成する文字の識別
情報とその並びに関する情報とを記・はする文字列情報
記憶手段とを備えた機械図面自動認識方法において、文
字列中からハイフンを抽出するハイフン抽出手段と、数
字専用辞書と、記号専用辞書と、文字認識時に前記文字
認識手段に対して用いる辞書を変更する辞書変更手段と
を備え、個々の文字列を構成する各々の文字認識時に文
字認識の対象とする文字の文字列中における位置に応じ
て用いる辞書を変更する。
作用 一般的に、機械図面中に含まれる文字列には、例えばr
4−R20Jで示すようにハイフンを含む文字列と、r
c15Jで示すようにハイフンを含まない文字列とがあ
る。ここに、ハイフンを含む文字列については、ハイフ
ンの左側にある部分を左文字列とし、ハイフンの右側に
ある部分を右文字列とすると、右文字列はあるものの形
状とそのサイズを示し、特にその先頭の1文字が記号に
よって形状を表しており、2文字目以降の部分の部分文
字列がサイズを表すことになる。上記のrR20Jなる
右文字列の場合であれば、半径が20の円弧(Rがこれ
を意味する)であることが表現される。このように右文
字列は、主に形状を表現する文字列といえる。一方、左
文字列は、右文字列が表す形状の個数を表現し、上例の
「4」の場合であれば、rR20Jという形状が、図面
中に4個存在することを意味する。また、ハイフンを含
まない文字列の場合には、その文字列はハイフンを含む
文字列における右文字列と全く同様に解釈でき、上例の
rc15)なる文字列は「1−C15Jの省略表現とし
て解釈できる。
このような機械図面中の文字列の特徴を考えた場合、図
面中における一般的な文字列は、形状とそのサイズ及び
その個数を表しており、文字列を解釈するにはこれらの
3種類の情報を明らかにすればよい。
そこで、Oから9までの10個の数字に関する文字認識
に必要な情報を登録した数字専用辞書と、形状を表現す
るために用いられる記号、例えばC2R,M等に関する
文字認識に必要な情報を登録した記号専用辞書とを設け
、文字認識の対象とする文字の文字列中における位置に
よってこれらの辞書が変更され使い分けられる。例えば
、ハイフンを含む文字列のハイフン直後の先頭文字やハ
イフンを含まない文字列の先頭文字については記号専用
辞書のみを用いて認識する。この文字位置には記号しか
存在しない筈であるので、記号専用辞書を用いることに
より、この部分の文字を数字と認識したりする誤認識が
大幅に減る。また、ハイフンに対する右文字列中の2番
目以降の後続の文字列やハイフンに対する左文字列やハ
イフンを含まない文字列の2番目以降の文字列について
は数字専用辞書のみを用いて認識する。この文字位置に
は数字しか存在しない筈であるので、数字専用辞書を用
いることにより、文字列の末尾を記号と認識したりする
ような誤認識が避けられる。
実施例 本発明の一実施例を図面を参照して説明する。
本実施例のアルゴリズムは、第1図に示すようなステッ
プで行われる。まず、図面1についての2値画像の獲得
が実行される。これは、第2図に示すように画像情報入
力手段(例えば、イメージスキャナ等)2により、紙面
上の図面1の情報を、計算機内部で処理しやすい画像情
報として取込む。
本実施例では、画像情報として2値画像を用いる例で示
すが、後述する作用が実現できれば、2値画像に限らず
、多値画像やランデータの形式であっても問題ない。読
込んだ2値画像は、後で再びアクセス可能な形式で画像
情報記憶手段3により記憶される。
次に、文字情報抽出手段4により文字情報の抽出を行う
。まず、画像情報記憶手段3に記憶された2値画像に対
して、連続する黒画素によるラベリングを実行すること
により、図面1中の情報は、複数の孤立した塊状要素に
分離できる。殆どの場合、その中で最大の要素は、外形
寸法や寸法線、寸法補助線といった実際の図形情報であ
り、残りの、相対的に小さな、多くの要素が、寸法値な
どを表現する文字などである。この際の大小比較は、外
接矩形の大きさを用いる方法が一般的かつ有効な方法で
ある。従って、予め準備した外接矩形のサイズを意味す
るパラメータを基準に、文字と思われる塊状要素を抽出
し、その文字の位置とイメージの再現に必要な情報とと
もに、文字情報記憶手段5に文字情報として記憶させる
この後、文字列情報抽出手段6により文字列情報を抽出
する。即ち、文字情報記憶手段5に記憶された個々の文
字の位置情報に基づいて、文字列情報の抽出を行う。方
法によっては、先に寸法線などを識別しておき、それら
に沿う形で並ぶ文字の集合を文字列とするといった方法
も考えられるが、その方法は如何なる方法であってもよ
い。重要な点は、各々の文字を構成する文字の並びであ
り、その際、個々の文字は、後でそのイメージを再現す
るために、文字情報記憶手段5において対応する文字に
対するエントリーへのリンクを持つ必要がある。これら
の文字列情報は文字列情報記憶手段7に記憶される。
文字列抽出後は、個々の文字列に対する処理が行われる
。まず、ハイフン抽出手段8によりハイフンの抽出が行
われる。このハイフン抽出処理は、処理対象の文字列の
構成文字数が4文字以上の場合だけ実行される。また、
ハイフンが文字列の端部にあることや、右文字列の構成
文字数が1文字であることは考えられないので、文字列
中の左端の1文字と右端部側の2文字を除く、個々の文
字についてハイフンの有無が調べられる。このハイフン
抽出処理の結果、ハイフンが存在する場合にはハイフン
の左側に位置する左文字列に対してはこれを左文字列情
報として左文字列情報記憶手段7L  (文字列情報記
憶手段7中の一部)に記憶させて左文字列解釈手段9L
を適用する一方、ハイフンの右側に位置する右文字列に
対してはこれを右文字列情報として右文字列情報記憶手
段7R(文字列情報記憶手段7中の一部)に記憶させて
右文字列解釈手段9Rを適用し、また、ハイフンが存在
しなかった場合には文字列全体に対して右文字列解釈手
段9Rを適用する。
ここに、左文字列解釈手段9Lによる左文字列の解釈処
理を説明する。この処理は、各記憶手段3.5,7Lに
おける画像情報、文字情報、左文字列情報を参照し、左
文字列解釈の適用対象がある場合に実行されるものであ
る。適用対象である文字列中の左文字列を構成する個々
の文字に対して、数字専用辞書10を用いて文字認識手
段11により文字認識処理を行う。数字専用辞書10は
0から9までの10個の数字に関する文字認識に必要な
情報のみを登録したものである。文字認識手段11によ
る認識結果である個数情報は、数値化された後、文字列
情報記憶手段7中の個数欄7aに記憶される。
次に、右文字列解釈手段9Rによる右文字列の解釈処理
を説明する。これは、適用対象である文字列を構成する
個々の文字に対して文字認識手段11によって文字認識
処理を行うものである。ここに、この処理のために、数
字専用辞書10とは別個に、機械図面中の文字列におい
て形状を表現するために用いられる記号(例えば、C,
M、R等)に関する文字認識に必要な情報を登録した記
号専用辞書12を用意し、かつ、何れの辞書10゜12
を用いるかを認識対象文字の位置に応じて辞書選択手段
(辞書変更手段)13により選択変更するものである。
まず、右文字列中の先頭文字を認識する時には記号専用
辞書12のみが選択され、この記号専用辞書12を用い
て文字認識手段11が文字認識を行う。この先頭文字に
ついての認識結果である形状情報は文字列情報記憶手段
7中の形状欄7bに記憶される。また、右文字列中の2
番目以降の個々の文字の認識に際しては数字専用辞書I
Oのみが用いられ、左文字列の場合と同様に認識処理さ
れ、その認識結果は数値化された後、サイズ情報として
、文字列情報記憶手段7中のサイズ欄7cに記憶される
このようにして、文字列全体についての文字認識がなさ
れる。この際、機械図面中に含まれる文字列の特徴に着
目し、数字が存在すべき文字位置では数字専用辞書10
を用いて認識処理を行い、記号が存在すべき文字位置で
は記号専用辞書12を用いて認識処理を行うので、ハイ
フンの左側で記号と認識するとか、文字列の末尾で記号
と認識するといった、誤認識を極力避けることができ、
認識率が向上する。また、各認識において、各々数字専
用辞書10又は記号専用辞書12の一方のみが用いられ
るので、処理速度も速いものとなる。
発明の効果 本発明は、上述したように機械図面中の文字列に用いら
れ得る数字、記号、ハイフン等の特徴に着目し、数字専
用辞書と記号専用辞書とを用意しておき、ハイフン情報
等を考慮し、個々の文字列を構成する各々の文字認識時
に文字認識の対象とする文字の文字列中における位置に
応じて用いる辞書を変更して認識するようにしたので、
数字が存在すべき位置では数字専用辞書のみによる認識
率の高い正確な認識を行い、記号が存在すべき位置では
記号専用辞書のみによる認識率の高い正確な認識を行う
ことができ、誤認識を極力避けることができる。
【図面の簡単な説明】
図面は本発明の一実施例を示し、第1図はフローチャー
ト、第2図ないし第4図はブロック図である。 1・・・図面、2・・・画像情報入力手段、3・・・画
像情報記憶手段、4・・・文字情報抽出手段、5・・・
文字情報記憶手段、6・・・文字列抽出手段、7・・・
文字列情報記憶手段、8・・・ハイフン抽出手段、10
・・・数字専用辞書、11・・・文字認識手段、12・
・・記号専用辞書、 ■ 3・・・辞書変更手段 出 願 人 株式会社 リ コ

Claims (1)

    【特許請求の範囲】
  1.  図面を画像情報として読込む画像情報入力手段と、読
    込まれた画像情報を記憶する画像情報記憶手段と、読込
    んだ画像情報中から文字のイメージとその位置とを抽出
    する文字情報抽出手段と、抽出された個々の文字に関す
    るイメージ情報や位置情報などの文字情報を記憶する文
    字情報記憶手段と、記憶された文字情報に基づき1文字
    単位に文字認識を行う文字認識手段と、認識された個々
    の文字の位置情報に基づいて文字列を抽出する文字列抽
    出手段と、抽出された各々の文字列を構成する文字の識
    別情報とその並びに関する情報とを記憶する文字列情報
    記憶手段とを備えた機械図面自動認識方法において、文
    字列中からハイフンを抽出するハイフン抽出手段と、数
    字専用辞書と、記号専用辞書と、文字認識時に前記文字
    認識手段に対して用いる辞書を変更する辞書変更手段と
    を備え、個々の文字列を構成する各々の文字認識時に文
    字認識の対象とする文字の文字列中における位置に応じ
    て用いる辞書を変更することを特徴とする機械図面自動
    認識方法。
JP63193955A 1988-08-03 1988-08-03 機械図面自動認識方法 Pending JPH0242578A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63193955A JPH0242578A (ja) 1988-08-03 1988-08-03 機械図面自動認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63193955A JPH0242578A (ja) 1988-08-03 1988-08-03 機械図面自動認識方法

Publications (1)

Publication Number Publication Date
JPH0242578A true JPH0242578A (ja) 1990-02-13

Family

ID=16316539

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63193955A Pending JPH0242578A (ja) 1988-08-03 1988-08-03 機械図面自動認識方法

Country Status (1)

Country Link
JP (1) JPH0242578A (ja)

Similar Documents

Publication Publication Date Title
JP2713622B2 (ja) 表形式文書読取装置
JP3640972B2 (ja) ドキュメントの解読又は解釈を行う装置
US9658989B2 (en) Apparatus and method for extracting and manipulating the reading order of text to prepare a display document for analysis
JPS63182793A (ja) 文字切り出し方式
JPH0242578A (ja) 機械図面自動認識方法
Nguyen et al. Preliminary results on ancient cham glyph recognition from cham inscription images
JP2001014311A5 (ja)
Ramteke et al. Tesseract OCR Recognition Based on Arabic
JP3208340B2 (ja) 続け書きテキストを認識する方法
JPH0247788B2 (ja)
JP2640472B2 (ja) 文字認識方法
JPH0614373B2 (ja) 文字読取方法
JP2746345B2 (ja) 文字認識の後処理方法
Tabeshadze A METHOD FOR DIGITAL RECOGNITION OF GEORGIAN TEXT FROM IMAGES
JPS6254380A (ja) 文字認識装置
TW202503699A (zh) 車牌辨識系統及其方法
JPS63269267A (ja) 文字認識方法
JP3151866B2 (ja) 英文字認識方法
KR920006874A (ko) 소정의 포맷을 갖는 문서의 인식방법
Antal et al. HHCS: A Dataset of Cipher Symbol Annotations From Handwritten Historical Encrypted Documents for Machine Learning Tasks
Yadav et al. Offline Handwritten Character Recognition using Neural Networks
JPH07104940B2 (ja) 図形認識装置
JPS5935469B2 (ja) 複数の文字セツトの読取りに適した文字認識方式
JPH01291394A (ja) 文字認識装置における文字コード出力方法
JP3116453B2 (ja) 英文字認識装置