JP2013246732A - 手書き文書検索装置、方法及びプログラム - Google Patents
手書き文書検索装置、方法及びプログラム Download PDFInfo
- Publication number
- JP2013246732A JP2013246732A JP2012121305A JP2012121305A JP2013246732A JP 2013246732 A JP2013246732 A JP 2013246732A JP 2012121305 A JP2012121305 A JP 2012121305A JP 2012121305 A JP2012121305 A JP 2012121305A JP 2013246732 A JP2013246732 A JP 2013246732A
- Authority
- JP
- Japan
- Prior art keywords
- handwritten document
- search
- unit
- handwritten
- classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/226—Character recognition characterised by the type of writing of cursive writing
- G06V30/2268—Character recognition characterised by the type of writing of cursive writing using stroke segmentation
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
【解決手段】実施形態によれば、取得部、分類部、特徴抽出部、検索部を備える。取得部は、筆跡データを含む手書き文書を取得する。分類部は、前記手書き文書を複数の領域に分類する。特徴抽出部は、前記分類結果に基づいて、前記領域の特徴を示す特徴量を抽出する。検索部は、前記特徴量に基づいて検索を実行する。
【選択図】図1
Description
ところで、行ブロックに相当するストローク列は軸と平行に筆記されているとは限らないので、表記の回転を吸収するため、右から左か、上から下か、左から右かの3種類の方向に正規化しても良い。文書平面上において、行ブロックの主成分分析により第一主成分を求め、その固有ベクトルと上記の3種類の方向とを比較して、上記の3種類の方向のうちで最も近い方向に、行ブロックを回転させる。なお、筆記されている言語が限定できる場合は、正規化する方向を限定することができる。例えば、アラビア語であるならば、左から右への方向のみに限定し、あるいは、日本語であるならば、右から左への方向と、上から下への方向の2方向に限定するなどが考えられる。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
Claims (11)
- 筆跡データを含む手書き文書を取得する取得部と、
前記手書き文書を複数の領域に分類する分類部と、
前記分類結果に基づいて、前記領域の特徴を示す特徴量を抽出する特徴抽出部と、
前記特徴量に基づいて検索を実行する検索部とを備えたことを特徴とする手書き文書検索装置。 - 前記分類部は、前記手書き文書を、文字領域と文字領域以外の領域とに分類する、請求項1に記載の手書き文書検索装置。
- 前記分類部は、前記手書き文書を、文字領域と図形領域と表領域とに分類する、請求項1に記載の手書き文書検索装置。
- 前記分類部は、前記文字領域について、更に、段落ブロック、行ブロック、単語ブロック、文字ブロック及び部首ブロックの階層うちの一部又は全部に分類する、請求項2または3に記載の手書き文書検索装置。
- 前記特徴量は、前記領域の種類を示す領域ラベルと該領域データとの対を含むものである、請求項2ないし4のいずれか1項に記載の手書き文書検索装置。
- 前記取得部は、手書き文字列をストローク単位で取得する、請求項1に記載の手書き文書検索装置。
- 前記取得部は、予め蓄積されている手書き文字列からユーザにより指定された文字列を含む文書を取得する、請求項1に記載の手書き文書検索装置。
- 前記検索部は、各々の前記領域に対応して予め用意されたテンプレート群に類似した手書き文書を検索する請求項1に記載の手書き文書検索装置。
- 前記検索部による検索結果を表示する表示部を更に含む請求項1ないし8のいずれか1項に記載の手書き文書検索装置。
- 手書き文書検索装置の手書き文書検索方法において、
筆跡データを含む手書き文書を取得するステップと、
前記手書き文書を複数の領域に分類するステップと、
前記分類結果に基づいて、前記領域の特徴を示す特徴量を抽出するステップと、
前記特徴量に基づいて検索を実行するステップとを備えたことを特徴とする手書き文書検索方法。 - コンピュータを手書き文書検索装置として機能させるためのプログラムであって、
筆跡データを含む手書き文書を取得する取得部と、
前記手書き文書を複数の領域に分類する分類部と、
前記分類結果に基づいて、前記領域の特徴を示す特徴量を抽出する特徴抽出部と、
前記特徴量に基づいて検索を実行する検索部とをコンピュータに実現させるためのプログラム。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2012121305A JP2013246732A (ja) | 2012-05-28 | 2012-05-28 | 手書き文書検索装置、方法及びプログラム |
| CN2012103481555A CN103455527A (zh) | 2012-05-28 | 2012-09-18 | 手写文件检索装置、方法以及记录介质 |
| US13/837,333 US9230181B2 (en) | 2012-05-28 | 2013-03-15 | Handwritten document retrieval apparatus and method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2012121305A JP2013246732A (ja) | 2012-05-28 | 2012-05-28 | 手書き文書検索装置、方法及びプログラム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2013246732A true JP2013246732A (ja) | 2013-12-09 |
Family
ID=49621643
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2012121305A Pending JP2013246732A (ja) | 2012-05-28 | 2012-05-28 | 手書き文書検索装置、方法及びプログラム |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US9230181B2 (ja) |
| JP (1) | JP2013246732A (ja) |
| CN (1) | CN103455527A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10049114B2 (en) | 2015-03-18 | 2018-08-14 | Kabushiki Kaisha Toshiba | Electronic device, method and storage medium |
Families Citing this family (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP6125333B2 (ja) * | 2013-05-31 | 2017-05-10 | 株式会社東芝 | 検索装置、方法及びプログラム |
| JP2016110389A (ja) * | 2014-12-05 | 2016-06-20 | 株式会社東芝 | 検索装置、方法及びプログラム |
| US9710701B2 (en) * | 2015-03-26 | 2017-07-18 | Lenovo (Singapore) Pte. Ltd. | Handwriting data search |
| WO2017022090A1 (ja) * | 2015-08-04 | 2017-02-09 | 株式会社ワコム | 手書きデータ描画方法及び手書きデータ描画装置 |
| US9866400B2 (en) * | 2016-03-15 | 2018-01-09 | Microsoft Technology Licensing, Llc | Action(s) based on automatic participant identification |
| US12548364B2 (en) * | 2022-03-24 | 2026-02-10 | International Business Machines Corporation | Search based on abstracted document structure image |
Citations (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH1055371A (ja) * | 1996-02-26 | 1998-02-24 | Matsushita Electric Ind Co Ltd | 文書探索および検索システム |
| JP2004227564A (ja) * | 2003-01-21 | 2004-08-12 | Microsoft Corp | インクディバイダおよび関連するアプリケーションプログラムインターフェース |
| JP2004348706A (ja) * | 2003-04-30 | 2004-12-09 | Canon Inc | 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム |
| JP2005208740A (ja) * | 2004-01-20 | 2005-08-04 | Ricoh Co Ltd | 部分画像検索装置及び部分画像検索プログラム |
| JP2007065763A (ja) * | 2005-08-29 | 2007-03-15 | Sharp Corp | 画像データ検索装置、画像データ検索方法、プログラム及び記録媒体 |
| JP2007164648A (ja) * | 2005-12-16 | 2007-06-28 | Ricoh Co Ltd | 類似画像検索装置、類似画像検索方法、プログラム及び情報記録媒体 |
| JP2009230427A (ja) * | 2008-03-21 | 2009-10-08 | Ricoh Co Ltd | 電子文書属性検出推定方法、電子文書属性検出推定装置、電子文書属性検出推定プログラム及び記憶媒体 |
| JP2010009426A (ja) * | 2008-06-27 | 2010-01-14 | Canon Inc | 情報処理装置及び情報処理方法 |
Family Cites Families (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5454046A (en) * | 1993-09-17 | 1995-09-26 | Penkey Corporation | Universal symbolic handwriting recognition system |
| US6108444A (en) * | 1997-09-29 | 2000-08-22 | Xerox Corporation | Method of grouping handwritten word segments in handwritten document images |
| JP4546291B2 (ja) * | 2005-03-01 | 2010-09-15 | キヤノン株式会社 | 画像処理装置およびその制御方法 |
| KR101486174B1 (ko) * | 2010-08-24 | 2015-01-23 | 노키아 코포레이션 | 중첩된 수기의 획들을 하나 이상의 그룹으로 분할하는 방법 및 장치 |
-
2012
- 2012-05-28 JP JP2012121305A patent/JP2013246732A/ja active Pending
- 2012-09-18 CN CN2012103481555A patent/CN103455527A/zh active Pending
-
2013
- 2013-03-15 US US13/837,333 patent/US9230181B2/en not_active Expired - Fee Related
Patent Citations (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH1055371A (ja) * | 1996-02-26 | 1998-02-24 | Matsushita Electric Ind Co Ltd | 文書探索および検索システム |
| JP2004227564A (ja) * | 2003-01-21 | 2004-08-12 | Microsoft Corp | インクディバイダおよび関連するアプリケーションプログラムインターフェース |
| JP2004348706A (ja) * | 2003-04-30 | 2004-12-09 | Canon Inc | 情報処理装置及び情報処理方法ならびに記憶媒体、プログラム |
| JP2005208740A (ja) * | 2004-01-20 | 2005-08-04 | Ricoh Co Ltd | 部分画像検索装置及び部分画像検索プログラム |
| JP2007065763A (ja) * | 2005-08-29 | 2007-03-15 | Sharp Corp | 画像データ検索装置、画像データ検索方法、プログラム及び記録媒体 |
| JP2007164648A (ja) * | 2005-12-16 | 2007-06-28 | Ricoh Co Ltd | 類似画像検索装置、類似画像検索方法、プログラム及び情報記録媒体 |
| JP2009230427A (ja) * | 2008-03-21 | 2009-10-08 | Ricoh Co Ltd | 電子文書属性検出推定方法、電子文書属性検出推定装置、電子文書属性検出推定プログラム及び記憶媒体 |
| JP2010009426A (ja) * | 2008-06-27 | 2010-01-14 | Canon Inc | 情報処理装置及び情報処理方法 |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10049114B2 (en) | 2015-03-18 | 2018-08-14 | Kabushiki Kaisha Toshiba | Electronic device, method and storage medium |
Also Published As
| Publication number | Publication date |
|---|---|
| US9230181B2 (en) | 2016-01-05 |
| CN103455527A (zh) | 2013-12-18 |
| US20130315483A1 (en) | 2013-11-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN114641753B (zh) | 使用机器学习从楼层平面图图纸进行合成数据生成和建筑信息模型(bim)要素提取 | |
| JP5717691B2 (ja) | 手書き文字検索装置、方法及びプログラム | |
| JP5774558B2 (ja) | 手書き文書処理装置、方法及びプログラム | |
| US8452108B2 (en) | Systems and methods for image recognition using graph-based pattern matching | |
| CN110050277A (zh) | 用于将手写文本转换成数字墨水的方法和系统 | |
| US7860313B2 (en) | Methods and apparatuses for extending dynamic handwriting recognition to recognize static handwritten and machine generated text | |
| JP2013246732A (ja) | 手書き文書検索装置、方法及びプログラム | |
| CN110503054A (zh) | 文本图像的处理方法及装置 | |
| CN101493887A (zh) | 基于半监督学习和哈希索引的眉毛图像分割方法 | |
| Halder et al. | Content independent writer identification on Bangla script: a document level approach | |
| CN101789073B (zh) | 字符识别装置及其字符识别方法 | |
| CN104573683A (zh) | 字符串识别方法和装置 | |
| JP2015099566A (ja) | 特徴算出装置、方法及びプログラム | |
| JP2011128924A (ja) | マンガ画像からテキストを抽出するマンガ画像解析装置、プログラム、検索装置及び方法 | |
| CN118135582A (zh) | 文献图表提取及分类方法、系统、计算机设备及存储介质 | |
| JP2013246733A (ja) | 文書検索装置、方法およびプログラム | |
| US9250802B2 (en) | Shaping device | |
| Yalniz et al. | Ottoman archives explorer: A retrieval system for digital Ottoman archives | |
| Roy et al. | Word retrieval in historical document using character-primitives | |
| Diem et al. | Semi-automated document image clustering and retrieval | |
| Saabni et al. | Keywords image retrieval in historical handwritten Arabic documents | |
| JP6030172B2 (ja) | 手書き文字検索装置、方法及びプログラム | |
| Xu et al. | Graph-based layout analysis for pdf documents | |
| Tehsin et al. | A caption text detection method from images/videos for efficient indexing and retrieval of multimedia data | |
| US20160034569A1 (en) | Search device |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20131219 |
|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20131226 |
|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20140109 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140325 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140507 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140707 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20141216 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150212 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20151006 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151204 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20160531 |
