JPH1139428A - 文書映像の方向修正方法 - Google Patents
文書映像の方向修正方法Info
- Publication number
- JPH1139428A JPH1139428A JP10070615A JP7061598A JPH1139428A JP H1139428 A JPH1139428 A JP H1139428A JP 10070615 A JP10070615 A JP 10070615A JP 7061598 A JP7061598 A JP 7061598A JP H1139428 A JPH1139428 A JP H1139428A
- Authority
- JP
- Japan
- Prior art keywords
- document
- character
- recognition reliability
- recognition
- document image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/24—Aligning, centring, orientation detection or correction of the image
- G06V10/242—Aligning, centring, orientation detection or correction of the image by image rotation, e.g. by 90 degrees
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Input (AREA)
Abstract
(57)【要約】
【課題】 文書映像の方向修正方法に係り、特に文字認
識を利用して方向が間違った文書を自動的に修正する方
法を提供する。 【解決手段】 文書映像から文字領域の一定部分を検出
する第1過程と、前記第1過程の文字領域中一定部分の
認識信頼度によって文書の傾斜を決定する第2過程と、
前記第2過程で決定された傾斜だけ文書を回転させ文字
認識する第3過程とを含む。これによると、文書認識器
で方向が間違った文書を自動的に修正することによって
多量の文書を自動的に処理でき、文書映像の認知できな
い視覚障害者も文書認識を正しく遂行することができ
る。
識を利用して方向が間違った文書を自動的に修正する方
法を提供する。 【解決手段】 文書映像から文字領域の一定部分を検出
する第1過程と、前記第1過程の文字領域中一定部分の
認識信頼度によって文書の傾斜を決定する第2過程と、
前記第2過程で決定された傾斜だけ文書を回転させ文字
認識する第3過程とを含む。これによると、文書認識器
で方向が間違った文書を自動的に修正することによって
多量の文書を自動的に処理でき、文書映像の認知できな
い視覚障害者も文書認識を正しく遂行することができ
る。
Description
【0001】
【発明の属する技術分野】本発明は文書映像の方向修正
方法に係り、特に文字認識を利用して方向の間違った文
書を自動的に修正する方法に関する。
方法に係り、特に文字認識を利用して方向の間違った文
書を自動的に修正する方法に関する。
【0002】
【従来の技術】一般的にスキャナ、カメラ等の映像入力
装置を通じて文書映像を読み、コンピュータを利用して
文字領域から文字を抽出、認識してテキスト情報を得る
ことを文字認識という。しかし文書映像の文字を認識す
ることにおいて、たびたび文書映像方向が上、下が入れ
換ったり左右90度だけ回転させたりする場合がある。
この場合、従来は使用者が直接文書の方向をまず手作業
で修正した後文字認識を再び始めなければならず、また
方向が間違った映像文書を含んだ多量の文書を自動的に
処理する場合、方向が間違った映像文書の内容は認識で
きないという問題点があった。
装置を通じて文書映像を読み、コンピュータを利用して
文字領域から文字を抽出、認識してテキスト情報を得る
ことを文字認識という。しかし文書映像の文字を認識す
ることにおいて、たびたび文書映像方向が上、下が入れ
換ったり左右90度だけ回転させたりする場合がある。
この場合、従来は使用者が直接文書の方向をまず手作業
で修正した後文字認識を再び始めなければならず、また
方向が間違った映像文書を含んだ多量の文書を自動的に
処理する場合、方向が間違った映像文書の内容は認識で
きないという問題点があった。
【0003】
【発明が解決しようとする課題】本発明が達成しようと
する技術的課題は、方向が間違った映像文書を自動的に
修正することによって多量の文書を自動的に処理しえ、
文書の方向を間違って入力しても文字認識が遂行できる
方法を提供することにある。
する技術的課題は、方向が間違った映像文書を自動的に
修正することによって多量の文書を自動的に処理しえ、
文書の方向を間違って入力しても文字認識が遂行できる
方法を提供することにある。
【0004】
【課題を解決するための手段】本発明は文書映像中文書
角度を自動的に認識する方法において、前記文書映像か
ら文字領域の一定部分を検出する第1過程と、前記第1
過程の文字領域中一定部分の認識信頼度によって文書の
傾斜を決定する第2過程と、前記第2過程から決定され
た傾斜だけ文書を回転させ文字認識する第3過程とを含
むことを特徴とする文書映像の方向修正方法である。
角度を自動的に認識する方法において、前記文書映像か
ら文字領域の一定部分を検出する第1過程と、前記第1
過程の文字領域中一定部分の認識信頼度によって文書の
傾斜を決定する第2過程と、前記第2過程から決定され
た傾斜だけ文書を回転させ文字認識する第3過程とを含
むことを特徴とする文書映像の方向修正方法である。
【0005】
【発明の実施の形態】以下、添付した図面を参照して本
発明の望ましい実施例を詳細に説明する。図1は本発明
による文書映像の方向修正装置のブロック図であり、文
書映像を入力するスキャナ部110、入力された文書映
像を貯蔵する第1メモリ部120、文書構造を分析する
文書構造分析部124、基準に対する文書映像の角度を
認識する文書角度認識部130、認識された文書映像を
貯蔵する第2メモリ部140よりなる。
発明の望ましい実施例を詳細に説明する。図1は本発明
による文書映像の方向修正装置のブロック図であり、文
書映像を入力するスキャナ部110、入力された文書映
像を貯蔵する第1メモリ部120、文書構造を分析する
文書構造分析部124、基準に対する文書映像の角度を
認識する文書角度認識部130、認識された文書映像を
貯蔵する第2メモリ部140よりなる。
【0006】図2は本発明による文書映像の方向修正方
法を示したフローチャートである。以下、図1の装置及
び図2のフローチャートを結合させて本発明の作用及び
効果を説明する。まず、スキャナ部110は文書映像の
全体イメージを読取り、第1メモリ部120はスキャナ
から入力された文書映像を貯蔵する。文書構造分析部1
24は第1メモリ120から読出された全体イメージか
らテキスト領域と非テキスト領域を分析し、文書角度認
識部130はテキストまたは文字領域Rの一定テキスト
部分R’、例えば文字列中最小限2行以上を認識して認
識信頼度(認識の正確性を示す数値)により文書の方向
(角度)を自動的に感知する。即ち、文書映像から文字
領域の一定部分R’を検出する(210過程)。ここで
認識信頼度は通常的に文字一つ一つに対し数値化された
等級に示される。次に検出されたR’の平均認識信頼度
C1 が認識信頼度に対する基準値C以上かを判別して
(212過程)、C1 がC以上であると文書映像の傾斜
dを0°に判別して(214過程)現在の方向で全体映
像を認識する(230過程)。ここで平均認識信頼度C
1 はR’に含まれる全体文字信頼度の合計をR’に含ま
れる全体文字数で割った値であり、文書角度認識部13
0は認識信頼度に対する基準値を実験によって決めて置
く。次にC1 がC以上でないとR’を90°回転させた
後の平均認識信頼度C2 とCを比較し(216過程)、
216過程でC2 がC以上であると文書映像の傾斜dを
90°と判別して(218過程)全体映像を90°方向
に認識する(230過程)。216過程でC2 がC以上
でないとR’を180°回転させた後の平均認識信頼度
C3 とCを比較し(220過程)、220過程でC3 が
C以上であると文書映像の傾斜dを180°と判別して
(222過程)全体映像を180°方向に認識する(2
30過程)。220過程でC3 がC以上でないとR’を
270°回転させた後の平均認識信頼度C4 とCを比較
し(224過程)、224過程でC4 がC以上であると
文書映像の傾斜dを270°と判別して(226過程)
全体映像を270°方向に認識する(230過程)。2
24過程でC4 がC以上でないとC1 、C2 、C3 、C
4 の中で最も良い平均信頼度を選択して(228過程)
該当する角度だけ全体映像を回転させ文書映像の角度と
して認識する(230過程)。文書角度認識部130で
方向が修正された文書映像は第2メモリ140に貯蔵さ
れて最終的に文書として認識される。
法を示したフローチャートである。以下、図1の装置及
び図2のフローチャートを結合させて本発明の作用及び
効果を説明する。まず、スキャナ部110は文書映像の
全体イメージを読取り、第1メモリ部120はスキャナ
から入力された文書映像を貯蔵する。文書構造分析部1
24は第1メモリ120から読出された全体イメージか
らテキスト領域と非テキスト領域を分析し、文書角度認
識部130はテキストまたは文字領域Rの一定テキスト
部分R’、例えば文字列中最小限2行以上を認識して認
識信頼度(認識の正確性を示す数値)により文書の方向
(角度)を自動的に感知する。即ち、文書映像から文字
領域の一定部分R’を検出する(210過程)。ここで
認識信頼度は通常的に文字一つ一つに対し数値化された
等級に示される。次に検出されたR’の平均認識信頼度
C1 が認識信頼度に対する基準値C以上かを判別して
(212過程)、C1 がC以上であると文書映像の傾斜
dを0°に判別して(214過程)現在の方向で全体映
像を認識する(230過程)。ここで平均認識信頼度C
1 はR’に含まれる全体文字信頼度の合計をR’に含ま
れる全体文字数で割った値であり、文書角度認識部13
0は認識信頼度に対する基準値を実験によって決めて置
く。次にC1 がC以上でないとR’を90°回転させた
後の平均認識信頼度C2 とCを比較し(216過程)、
216過程でC2 がC以上であると文書映像の傾斜dを
90°と判別して(218過程)全体映像を90°方向
に認識する(230過程)。216過程でC2 がC以上
でないとR’を180°回転させた後の平均認識信頼度
C3 とCを比較し(220過程)、220過程でC3 が
C以上であると文書映像の傾斜dを180°と判別して
(222過程)全体映像を180°方向に認識する(2
30過程)。220過程でC3 がC以上でないとR’を
270°回転させた後の平均認識信頼度C4 とCを比較
し(224過程)、224過程でC4 がC以上であると
文書映像の傾斜dを270°と判別して(226過程)
全体映像を270°方向に認識する(230過程)。2
24過程でC4 がC以上でないとC1 、C2 、C3 、C
4 の中で最も良い平均信頼度を選択して(228過程)
該当する角度だけ全体映像を回転させ文書映像の角度と
して認識する(230過程)。文書角度認識部130で
方向が修正された文書映像は第2メモリ140に貯蔵さ
れて最終的に文書として認識される。
【0007】
【発明の効果】前述したように本発明によると、文書認
識器で方向が間違った文書を自動的に修正することによ
って多量の文書を自動的に処理でき、文書映像が認知で
きない視覚障害者も文書認識を正しく遂行できる。
識器で方向が間違った文書を自動的に修正することによ
って多量の文書を自動的に処理でき、文書映像が認知で
きない視覚障害者も文書認識を正しく遂行できる。
【図1】本発明による文書映像の方向修正装置のブロッ
ク図である。
ク図である。
【図2】本発明による文書映像の方向修正方法を示すフ
ローチャートである。
ローチャートである。
110 スキャナ部 120 第1メモリ部 124 文書構造分析部 130 文書角度認識部 140 第2メモリ部
Claims (4)
- 【請求項1】 文書映像の文書角度を自動的に修正する
方法において、 前記文書映像から文字領域の一定部分を検出する第1過
程と、 前記第1過程の一定部分の文字認識信頼度に従って文書
の傾斜を決定する第2過程と、 前記第2過程で決定された傾斜だけ文書を回転させ文字
認識する第3過程とを含むことを特徴とする文書映像の
方向修正方法。 - 【請求項2】 前記第2過程は、 一定部分の文字平均認識信頼度が基準認識信頼度より大
きいと現在の文書角度を傾斜で決定し、また文書領域の
一定部分を所定角度だけ回転させた後一定部分の文字平
均認識信頼度が基準になる認識信頼度より大きいと、そ
の角度を傾斜と決定する過程を含むことを特徴とする請
求項1に記載の文書映像の方向修正方法。 - 【請求項3】 前記平均認識信頼度は一定部分の文字に
含まれる全体の文字信頼度の合計を文字領域中一定部分
に含まれる全体文字数で割った値であることを特徴とす
る請求項2に記載の文書映像の方向修正方法。 - 【請求項4】 一定部分の文字平均認識信頼度が基準に
なる認識信頼度より少ないと複数個の傾斜の中で平均認
識信頼度が最も大きい角度を傾斜と決定する過程をさら
に含むことを特徴とする請求項2に記載の文書映像の方
向修正方法。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR32913/1997 | 1997-07-15 | ||
| KR1019970032913A KR100247970B1 (ko) | 1997-07-15 | 1997-07-15 | 문서 영상의 방향 교정방법 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH1139428A true JPH1139428A (ja) | 1999-02-12 |
Family
ID=19514563
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP10070615A Pending JPH1139428A (ja) | 1997-07-15 | 1998-03-19 | 文書映像の方向修正方法 |
Country Status (4)
| Country | Link |
|---|---|
| US (1) | US6169822B1 (ja) |
| JP (1) | JPH1139428A (ja) |
| KR (1) | KR100247970B1 (ja) |
| CN (1) | CN1108582C (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8805080B2 (en) | 2011-06-29 | 2014-08-12 | Fujitsu Limited | Method of and device for identifying direction of characters in image block |
Families Citing this family (26)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100405636B1 (ko) * | 2000-05-23 | 2003-11-15 | 이성환 | 시각 장애인용 착용 가능 보행 안내 장치 및 방법 |
| RU2003108433A (ru) * | 2003-03-28 | 2004-09-27 | Аби Софтвер Лтд. (Cy) | Способ предварительной обработки изображения машиночитаемой формы |
| US20110188759A1 (en) * | 2003-06-26 | 2011-08-04 | Irina Filimonova | Method and System of Pre-Analysis and Automated Classification of Documents |
| JP4350414B2 (ja) | 2003-04-30 | 2009-10-21 | キヤノン株式会社 | 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム |
| RU2635259C1 (ru) | 2016-06-22 | 2017-11-09 | Общество с ограниченной ответственностью "Аби Девелопмент" | Способ и устройство для определения типа цифрового документа |
| JP2005311766A (ja) * | 2004-04-22 | 2005-11-04 | Fuji Xerox Co Ltd | 画像読み取り装置 |
| CN100382097C (zh) * | 2004-08-10 | 2008-04-16 | 明基电通股份有限公司 | 文件倾斜角度的估算方法及其装置 |
| CN100338618C (zh) * | 2004-09-30 | 2007-09-19 | 致伸科技股份有限公司 | 一种倾斜图像自动校正方法 |
| CN100361140C (zh) * | 2005-12-14 | 2008-01-09 | 北京北大方正电子有限公司 | 一种检测文档扫描图像旋转角度和缩放比例的方法 |
| US8144989B2 (en) * | 2007-06-21 | 2012-03-27 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying text orientation in a digital image |
| US8208725B2 (en) * | 2007-06-21 | 2012-06-26 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying text orientation in a digital image |
| US8340430B2 (en) * | 2007-07-10 | 2012-12-25 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying digital image characteristics |
| US8023770B2 (en) | 2008-05-23 | 2011-09-20 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying the orientation of a digital image |
| US8023741B2 (en) * | 2008-05-23 | 2011-09-20 | Sharp Laboratories Of America, Inc. | Methods and systems for detecting numerals in a digital image |
| US8160365B2 (en) * | 2008-06-30 | 2012-04-17 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying digital image characteristics |
| US20110176154A1 (en) * | 2010-01-18 | 2011-07-21 | Canon Kabushiki Kaisha | Image processing apparatus, image processing method, and storage medium |
| CN101847209B (zh) * | 2010-06-01 | 2012-06-06 | 福建新大陆电脑股份有限公司 | 一种字符图像校正方法 |
| CN102902947B (zh) * | 2011-07-27 | 2015-05-27 | 阿里巴巴集团控股有限公司 | 一种图像识别显示方法、装置及用户设备 |
| US9092667B2 (en) | 2012-08-27 | 2015-07-28 | Symbol Technologies, Llc | Arrangement for and method of reading forms in correct orientation by image capture |
| CN103793903B (zh) * | 2012-10-29 | 2018-07-27 | 方正国际软件(北京)有限公司 | 一种利用条形码识别的图像分割方法及系统 |
| US9076058B2 (en) | 2013-01-29 | 2015-07-07 | Sharp Laboratories Of America, Inc. | Methods, systems and apparatus for determining orientation in a document image |
| CN104915648B (zh) * | 2015-06-02 | 2018-07-20 | 北京天创征腾信息科技有限公司 | 文档/单证方向检测方法和检测装置 |
| KR102424691B1 (ko) * | 2015-11-16 | 2022-07-26 | 삼성전자주식회사 | 조리장치 및 그 제어방법 |
| CN105894526A (zh) * | 2016-04-29 | 2016-08-24 | 广东小天才科技有限公司 | 图片的校正方法及装置 |
| US10121250B2 (en) | 2016-12-01 | 2018-11-06 | International Business Machines Corporation | Image orientation detection |
| CN107194397A (zh) * | 2017-05-09 | 2017-09-22 | 珠海赛纳打印科技股份有限公司 | 卡片放置方向的识别方法、装置以及图像处理装置 |
Family Cites Families (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR910007752B1 (ko) * | 1988-01-18 | 1991-09-30 | 가부시키가이샤 도시바 | 문자인식시스템 |
| JP2716980B2 (ja) | 1988-09-16 | 1998-02-18 | 株式会社日立製作所 | 画像情報装置の正常画像判定方法 |
| US5077811A (en) * | 1990-10-10 | 1991-12-31 | Fuji Xerox Co., Ltd. | Character and picture image data processing system |
| JPH04195485A (ja) * | 1990-11-28 | 1992-07-15 | Hitachi Ltd | 画像情報入力装置 |
| US5235651A (en) * | 1991-08-06 | 1993-08-10 | Caere Corporation | Rotation of images for optical character recognition |
| JP3186246B2 (ja) * | 1992-09-24 | 2001-07-11 | 株式会社日立製作所 | 文書読取装置 |
| JP3727971B2 (ja) | 1995-02-01 | 2005-12-21 | キヤノン株式会社 | 文書処理装置、及び文書処理方法 |
-
1997
- 1997-07-15 KR KR1019970032913A patent/KR100247970B1/ko not_active Expired - Fee Related
-
1998
- 1998-03-16 CN CN98105597A patent/CN1108582C/zh not_active Expired - Fee Related
- 1998-03-17 US US09/042,649 patent/US6169822B1/en not_active Expired - Fee Related
- 1998-03-19 JP JP10070615A patent/JPH1139428A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8805080B2 (en) | 2011-06-29 | 2014-08-12 | Fujitsu Limited | Method of and device for identifying direction of characters in image block |
Also Published As
| Publication number | Publication date |
|---|---|
| CN1205485A (zh) | 1999-01-20 |
| KR19990010215A (ko) | 1999-02-05 |
| KR100247970B1 (ko) | 2000-03-15 |
| CN1108582C (zh) | 2003-05-14 |
| US6169822B1 (en) | 2001-01-02 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH1139428A (ja) | 文書映像の方向修正方法 | |
| US5889897A (en) | Methodology for OCR error checking through text image regeneration | |
| JPH08212298A (ja) | 文書方向自動判別装置、及び文書方向自動補正装置 | |
| JP2835178B2 (ja) | 文書読取装置 | |
| JP2010061471A (ja) | 文字認識装置およびプログラム | |
| JP3787377B2 (ja) | 文書方向判定方法及び装置及び文字認識方法及び装置 | |
| EP3940628A1 (en) | Image processing device, image reading device, image processing method, and program | |
| JP2000113106A (ja) | 文書画像処理装置 | |
| JPH0728935A (ja) | 文書画像処理装置 | |
| JPH0490083A (ja) | 文字認識装置 | |
| JP2001236467A (ja) | パターン認識方法、装置、およびパターン認識プログラムを記録した記録媒体 | |
| JP4697387B2 (ja) | 原稿画像判定装置、原稿画像判定方法及びそのプログラム | |
| JPH117493A (ja) | 文字認識処理装置 | |
| JP4270767B2 (ja) | 罫線情報処理方法と罫線情報処理プログラムと画像処理装置及び記憶媒体 | |
| JP2002207960A (ja) | 認識文字修正方法及び認識文字修正プログラム | |
| JPH11250179A (ja) | 文字認識装置および文字認識方法 | |
| JPH08202887A (ja) | 画像処理装置及びその方法 | |
| JPH04276888A (ja) | 文字読取装置 | |
| JP2004013704A (ja) | 文字認識処理における原稿方向判別方法 | |
| JP2963474B2 (ja) | 類似文字識別方法 | |
| JPH0535910A (ja) | 画像処理方法及び装置 | |
| JPH05189604A (ja) | 光学的文字読取装置 | |
| JPH10124610A (ja) | 光学式文字読取装置 | |
| JP2001266066A (ja) | 文字認識装置および文字認識方法 | |
| JPH03217993A (ja) | 文字サイズ認識装置 |