JP5771108B2 - 光学式文字認識で生成したテキストデータの校正を支援するためのシステム、方法、プログラム - Google Patents
光学式文字認識で生成したテキストデータの校正を支援するためのシステム、方法、プログラム Download PDFInfo
- Publication number
- JP5771108B2 JP5771108B2 JP2011216500A JP2011216500A JP5771108B2 JP 5771108 B2 JP5771108 B2 JP 5771108B2 JP 2011216500 A JP2011216500 A JP 2011216500A JP 2011216500 A JP2011216500 A JP 2011216500A JP 5771108 B2 JP5771108 B2 JP 5771108B2
- Authority
- JP
- Japan
- Prior art keywords
- calibration
- character
- tool
- carpet
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/98—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Description
120…スキャナ
Claims (17)
- 光学式文字認識で生成されたテキストデータの校正を支援するためのシステムであって、
前記テキストデータのカーペット校正を行うための第1の校正ツールと、
前記テキストデータのサイド・バイ・サイド校正を行うための第2の校正ツールと、
前記第1および第2の校正ツールで行った校正オペレーションのログを記録するための記憶部と、
前記第1の校正ツールのカーペット校正を行う単位である属性ごとに、前記ログに基づいて算出された前記第1および第2の校正ツールを使用して校正を行った場合に要する時間の第1の推測値と、第1の校正ツールを使用することなく第2の校正ツールを使用して校正を行った場合に要する時間の第2の推測値を比較して当該属性の校正に第1の校正ツールを使用するかどうかを決定する解析部と、
を備える、システム。 - 前記第1および第2の校正ツールを使用して校正を行った場合は、前記第1の校正ツールによる校正を行った後で、前記第2の校正ツールによる校正が行われる請求項1に記載のシステム。
- 前記カーペット校正を行う単位である属性が、文字である請求項1又は2に記載のシステム。
- 前記第1の校正ツールによる校正を行った後で、前記第2の校正ツールによる校正が行われ、前記第1の校正ツールによる校正において、文字認識の正誤が不明である場合に、不明であることを示すマークが付される、請求項3に記載のシステム。
- 前記不明であることを示すマークが付された文字を、カーペット校正において正誤不明であることを示すようにオペレータに提示する、請求項4に記載のシステム。
- 前記ログに基づいて、ログ統計情報を算出する算出部を備える、請求項1から5のいずれか1項に記載のシステム。
- 前記算出部が、複数の文字をクラスタリングし、クラスタごとにログ情報から統計情報を算出する、請求項6から9のいずれか1項に記載のシステム。
- 前記算出部が、(1)すべての文字に対する1つのクラスタの形成、(2)統計情報の各パラメータの空間によるクラスタの形成、または、(3)文字種ごとのクラスタの形成、のいずれかを実行することができる、請求項10に記載のシステム。
- 前記解析部の決定に基づいて前記属性を第1の校正ツールを使用する対象であることを記述するリストを備える、請求項1から11のいずれか1項に記載のシステム。
- 前記リストに基づいて、前記第1および第2の校正ツールの制御を行う制御部を備える、請求項12に記載のシステム。
- 前記第1のツールが、コンテキスト付きカーペット校正ツールである、請求項1から13のいずれか1項に記載のシステム。
- 前記第2の校正ツールが、ページ、文章、行のうちの少なくとも1つの単位でイメージデータとテキストデータを並べて提示する、請求項1から14のいずれか1項に記載のシステム。
- 請求項1乃至15のいずれかに記載のシステムとしてコンピュータを機能させることができる、プログラム。
- 光学式文字認識で生成されたテキストデータの校正を支援するための方法であって、
前記テキストデータのカーペット校正を行うための第1の校正ツールを準備するステップと、
前記テキストデータのサイド・バイ・サイド校正を行うための第2の校正ツールを準備するステップと、
前記第1および第2の校正ツールで行った校正オペレーションのログを記録するステップと、
前記第1の校正ツールのカーペット校正を行う単位である属性ごとに、前記ログに基づいて算出された前記第1および第2の校正ツールを使用して校正を行った場合に要する時間の第1の推測値と、第1の校正ツールを使用することなく第2の校正ツールを使用して校正を行った場合に要する時間の第2の推測値を比較して当該属性の校正に第1の校正ツールを使用するかどうかを決定するステップと、
を含む、方法。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2011216500A JP5771108B2 (ja) | 2011-09-30 | 2011-09-30 | 光学式文字認識で生成したテキストデータの校正を支援するためのシステム、方法、プログラム |
| US13/630,474 US8953910B2 (en) | 2011-09-30 | 2012-09-28 | Proof reading of text data generated through optical character recognition |
| US13/669,789 US8971670B2 (en) | 2011-09-30 | 2012-11-06 | Proof reading of text data generated through optical character recognition |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2011216500A JP5771108B2 (ja) | 2011-09-30 | 2011-09-30 | 光学式文字認識で生成したテキストデータの校正を支援するためのシステム、方法、プログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2013077157A JP2013077157A (ja) | 2013-04-25 |
| JP5771108B2 true JP5771108B2 (ja) | 2015-08-26 |
Family
ID=47992654
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2011216500A Expired - Fee Related JP5771108B2 (ja) | 2011-09-30 | 2011-09-30 | 光学式文字認識で生成したテキストデータの校正を支援するためのシステム、方法、プログラム |
Country Status (2)
| Country | Link |
|---|---|
| US (2) | US8953910B2 (ja) |
| JP (1) | JP5771108B2 (ja) |
Families Citing this family (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5661214B1 (ja) * | 2014-09-02 | 2015-01-28 | 三菱電機インフォメーションシステムズ株式会社 | 文字データ修正方法、文字データ修正装置およびプログラム |
| US11087409B1 (en) | 2016-01-29 | 2021-08-10 | Ocrolus, LLC | Systems and methods for generating accurate transaction data and manipulation |
| JP6589905B2 (ja) * | 2017-02-13 | 2019-10-16 | 京セラドキュメントソリューションズ株式会社 | 画像形成装置 |
| JP6294554B1 (ja) * | 2017-10-24 | 2018-03-14 | サンネット株式会社 | 文字表示システム、文字表示装置及び文字表示システムを実現させるためのプログラム |
| JP7558644B2 (ja) * | 2019-03-29 | 2024-10-01 | キヤノン株式会社 | 画像処理装置、その制御方法及びプログラム |
| CN110751140A (zh) * | 2019-09-16 | 2020-02-04 | 深圳市国信合成科技有限公司 | 字符批量识别方法、装置和计算机设备 |
| JP7831837B2 (ja) * | 2020-04-24 | 2026-03-17 | 株式会社LegalOn Technologies | 文書処理プログラム、情報処理装置及び文書処理方法 |
| CN113780285B (zh) * | 2021-09-27 | 2024-03-15 | 常州市公共资源交易中心 | 证照分析方法、装置和存储介质 |
| JP7377565B2 (ja) * | 2022-01-05 | 2023-11-10 | キャディ株式会社 | 図面検索装置、図面データベース構築装置、図面検索システム、図面検索方法、及びプログラム |
Family Cites Families (20)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH03240183A (ja) | 1990-02-16 | 1991-10-25 | Nippon Telegr & Teleph Corp <Ntt> | 認識文字自動修正方式 |
| JPH05346970A (ja) * | 1991-04-04 | 1993-12-27 | Fuji Xerox Co Ltd | 文書認識装置 |
| JPH05314303A (ja) | 1992-05-11 | 1993-11-26 | Fuji Facom Corp | 誤読文字修正方法 |
| JP3240183B2 (ja) | 1992-06-24 | 2001-12-17 | 日東電工株式会社 | 試料中の抗原または抗体の測定方法およびその測定装置 |
| JPH06290297A (ja) | 1993-04-02 | 1994-10-18 | Sharp Corp | 文字認識装置 |
| JPH0757042A (ja) | 1993-08-17 | 1995-03-03 | Nippon Telegr & Teleph Corp <Ntt> | 文字読取方法および装置 |
| JPH09179934A (ja) | 1995-12-22 | 1997-07-11 | Oki Electric Ind Co Ltd | 文字読取装置 |
| US5923792A (en) * | 1996-02-07 | 1999-07-13 | Industrial Technology Research Institute | Screen display methods for computer-aided data entry |
| JPH11110480A (ja) * | 1997-07-25 | 1999-04-23 | Kuraritec Corp | テキストの表示方法およびその装置 |
| JP3029822B2 (ja) * | 1998-06-11 | 2000-04-10 | 株式会社ジャストシステム | 文書処理装置、文書処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
| US6351574B1 (en) * | 1998-12-11 | 2002-02-26 | International Business Machines Corporation | Interactive verification of OCRed characters |
| JP2002073827A (ja) * | 2000-08-31 | 2002-03-12 | Fujitsu Ltd | 校正者の能力管理方法、及び装置 |
| US7111255B2 (en) * | 2001-06-25 | 2006-09-19 | International Business Machines Corporation | Time-based evaluation of data verification results |
| US7039256B2 (en) * | 2001-07-12 | 2006-05-02 | International Business Machines Corporation | Efficient verification of recognition results |
| JP2003099709A (ja) | 2001-09-25 | 2003-04-04 | Toshiba Corp | 誤読文字修正方法及び光学的文字認識装置 |
| JP4110786B2 (ja) | 2002-01-30 | 2008-07-02 | セイコーエプソン株式会社 | 認識文字列修正方法およびその装置並びにコンピュータプログラム |
| JP2004341754A (ja) * | 2003-05-14 | 2004-12-02 | Matsushita Electric Ind Co Ltd | 文字認識結果修正装置及びその方法並びに文字認識結果修正プログラム |
| JP4172584B2 (ja) * | 2004-04-19 | 2008-10-29 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 文字認識結果出力装置、文字認識装置、その方法及びプログラム |
| US7849398B2 (en) * | 2007-04-26 | 2010-12-07 | Xerox Corporation | Decision criteria for automated form population |
| JP5314303B2 (ja) | 2008-03-17 | 2013-10-16 | パナソニック株式会社 | 貯湯式給湯システム |
-
2011
- 2011-09-30 JP JP2011216500A patent/JP5771108B2/ja not_active Expired - Fee Related
-
2012
- 2012-09-28 US US13/630,474 patent/US8953910B2/en not_active Expired - Fee Related
- 2012-11-06 US US13/669,789 patent/US8971670B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| US8953910B2 (en) | 2015-02-10 |
| JP2013077157A (ja) | 2013-04-25 |
| US8971670B2 (en) | 2015-03-03 |
| US20130084011A1 (en) | 2013-04-04 |
| US20130085746A1 (en) | 2013-04-04 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5771108B2 (ja) | 光学式文字認識で生成したテキストデータの校正を支援するためのシステム、方法、プログラム | |
| US11182604B1 (en) | Computerized recognition and extraction of tables in digitized documents | |
| US8452099B2 (en) | Optical character recognition (OCR) engines having confidence values for text types | |
| JP6874729B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
| EP4246344A1 (en) | Information processing device, information processing method, and program | |
| JP2016095753A (ja) | 文字認識システム及び文字認識方法 | |
| JPH0830722A (ja) | 文書書式認識実行方法および装置 | |
| WO2019194051A1 (ja) | 画像処理装置、画像処理方法、およびプログラムを記憶する記憶媒体 | |
| US20060285746A1 (en) | Computer assisted document analysis | |
| CN114186532B (zh) | 一种审单处理方法及装置 | |
| US12400463B2 (en) | Information processing apparatus, information processing method, and recording medium | |
| JP2010061471A (ja) | 文字認識装置およびプログラム | |
| US12148234B2 (en) | Information processing with iteratively improved estimates of data attributes based on user modifications, and apparatus, method, and storage medium thereof | |
| CN113841156B (zh) | 基于图像识别的控制方法与装置 | |
| US20180067916A1 (en) | Analysis apparatus, analysis method, and recording medium | |
| US20060008148A1 (en) | Character recognition device and method | |
| CN110647628B (zh) | 一种自动化标检方法及系统 | |
| US20210224529A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
| US11482029B2 (en) | Image processing device, image processing method, and recording medium | |
| WO2002003240A1 (en) | Proofreading system of chinese characters by means of one-to-one comparison | |
| JP4160206B2 (ja) | 文字認識装置を利用したデータベース登録方法 | |
| JP2017111500A (ja) | 文字認識装置及びプログラム | |
| JP2019204146A (ja) | データ変換装置、画像処理装置及びプログラム | |
| JP2020087112A (ja) | 帳票処理装置および帳票処理方法 | |
| US20210042555A1 (en) | Information Processing Apparatus and Table Recognition Method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140507 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150126 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150210 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150507 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150609 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150626 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 5771108 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| LAPS | Cancellation because of no payment of annual fees |
