DK200800356A - Fremgangsmåde til skanning - Google Patents

Fremgangsmåde til skanning Download PDF

Info

Publication number
DK200800356A
DK200800356A DK200800356A DKPA200800356A DK200800356A DK 200800356 A DK200800356 A DK 200800356A DK 200800356 A DK200800356 A DK 200800356A DK PA200800356 A DKPA200800356 A DK PA200800356A DK 200800356 A DK200800356 A DK 200800356A
Authority
DK
Denmark
Prior art keywords
computer
implemented method
predefined
character
recording
Prior art date
Application number
DK200800356A
Other languages
English (en)
Inventor
Nielsen Lars Stig
Meibom Jacob
Original Assignee
Jala Aps
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to DK200800356A priority Critical patent/DK176834B1/da
Application filed by Jala Aps filed Critical Jala Aps
Priority to US12/667,930 priority patent/US8605297B2/en
Priority to PCT/EP2009/052616 priority patent/WO2009109627A1/en
Priority to BRPI0910255A priority patent/BRPI0910255A2/pt
Priority to MX2010009615A priority patent/MX2010009615A/es
Priority to JP2010549149A priority patent/JP2011513850A/ja
Priority to EA201071042A priority patent/EA201071042A1/ru
Priority to CN200980108147XA priority patent/CN101981569A/zh
Priority to EP09716359A priority patent/EP2260412A1/en
Priority to CA2717378A priority patent/CA2717378A1/en
Publication of DK200800356A publication Critical patent/DK200800356A/da
Application granted granted Critical
Publication of DK176834B1 publication Critical patent/DK176834B1/da

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Character Discrimination (AREA)
  • Processing Or Creating Images (AREA)
  • Character Input (AREA)
  • Facsimiles In General (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Cleaning In Electrography (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Storage Device Security (AREA)

Claims (28)

1. Computer-implementeret fremgangsmåde til skanning af et dokument, omfattende trinnene: * erhvervelse, til en hukommelse, af mindst én optagelse begrænset til et felt, der dækker et afgrænset område af et dokument; - processering af den i det mindste ene optagelse for at udføre karakter genkendelse; - når en karakter er genkendt, registrering af den i en hukommelse; og udførsel af de ovenstående trin gentagende gange, mens der optages på forskudte positioner for gradvist at opnå en karakterstreng; kendetegnet ved: - evaluering af strengen i forhold til en foruddefineret betingelse; - hvis betingelsen ikke er opfyldt, sletning fra hukommelsen af mindst en del af strengen og mindst en del af den i det mindste ene optagelse; - hvis betingelsen er opfyldt, bestemmelse af hvorvidt der skal tilvejebringes et output.
2. Computer-implementeret fremgangsmåde ifølge krav 1, hvorved den foruddefinerede betingelse omfatter, at karakterstrengen forekommer i et foruddefineret nøgleord.
3. Computer-implementeret fremgangsmåde ifølge krav 1 eller 2, hvorved den foruddefinerede betingelse omfatter, at mindre end et foruddefineret antal af karakterer evalueres.
4. Computer-implementeret fremgangsmåde ifølge et hvilket som helst af kravene 1-3, hvorved den foruddefinerede betingelse omfatter, at skrifttypestørrelsen af karakteren er mindre end en foruddefineret skrifttype-størrelse.
5. Computer-implementeret fremgangsmåde ifølge et hvilket som helst af kravene 1-4, hvorved bestemmelse af, hvorvidt et output skal tilvejebringes, er baseret på, hvorvidt karakterstregen matcher et foruddefineret nøgleord.
6. Computer-implementeret fremgangsmåde ifølge et hvilket som helst af kravene 1-5, hvorved outputtet er en reference til en placering i dokumentet omfattende den i det mindste ene optagelse, som indeholder indhold, der bidrager til strengen, som blev evalueret positivt i forhold til betingelsen.
7. Computer-implementeret fremgangsmåde ifølge et hvilket som helst af kravene 1-6, hvorved et nøgleord, der er matchet med strengen, anbringes i en dokument-skabelon på en position, der repræsenterer positionen af det tilsvarende ord i dokumentet, der er underlagt skanningen.
8. Computer-implementeret fremgangsmåde ifølge et hvilket som helst af kravene 1-7, hvorved information om positionen i dokumentet og/eller længden af de fundne nøgleord genereres og lagres.
9. Computer-implementeret fremgangsmåde ifølge et hvilket som helst af kravene 1 -8, hvorved outputtet omfatter koder, der repræsenterer karakter-strengen, som opfylder den foruddefinerede betingelse.
10. Computer-implementeret fremgangsmåde ifølge et hvilket som helst af kravene 1-9, hvorved outputtet omfatter en reference til et nøgleord iblandt foruddefinerede nøgleord i en foruddefineret nøgleordsliste.
11. Computer-implementeret fremgangsmåde ifølge et hvilket som helst af kravene 1-10, hvorved outputtet omfatter et nøgleord iblandt foruddefinerede nøgleord.
12. Computer-implementeret fremgangsmåde ifølge et hvilket som helst af kravene 1-11, hvorved outputtet omfatter et nøgleord iblandt foruddefinerede nøgleord og en reference til en position, der repræsenterer positionen af det tilsvarende ord i dokumentet, der er underlagt skanning.
13. Computer-implementeret fremgangsmåde ifølge et hvilket som helst af kravene 1-12, hvorved karakterstrengen slettes, når et output er tilvejebragt.
14. Computer-implementeret fremgangsmåde ifølge et hvilket som helst af kravene 1-13, hvorved fremgangsmåden omfatter sammensætning af udvalgte optagelser til en sammensat optagelse.
15. Computer-implementeret fremgangsmåde ifølge krav 14, hvorved den sammensatte optagelse processeres for at udføre genkendelse af en karakter, som strækker sig over en flerhed af udvalgte optagelser.
16. Computer-implementeret fremgangsmåde ifølge krav 14, hvorved et trin til sammensætning af udvalgte optagelser til en sammensat optagelse udføres, når processering af den i det mindste ene optagelse for at genkende en karakter ikke resulterede i genkendelse af en karakter.
17. Computer-implementeret fremgangsmåde ifølge krav 14, hvorved den foruddefinerede betingelse omfatter, hvorvidt sammensatte optagelser resulterer i genkendelse af en karakter, når et foruddefineret antal optagelser er blevet sammensat.
18. Computer-implementeret fremgangsmåde ifølge krav 14, hvorved den foruddefinerede betingelse omfatter, at karakterstrengen forekommer i et af foruddefinerede nøgleord.
19. Computer-implementeret fremgangsmåde ifølge krav 14, hvorved den foruddefinerede betingelse omfatter at færre end et foruddefineret antal karakterer evalueres.
20. Computer-implementeret fremgangsmåde ifølge et hvilket som helst af kravene 14-19, hvorved den foruddefinerede betingelse omfatter, at skrifttypestørrelsen af karakteren er mindre end en foruddefineret skrifttypestørrelse.
21. Computer-implementeret fremgangsmåde ifølge et hvilket som helst af kravene 14-20, hvorved den foruddefinerede betingelse omfatter, at den samme farve forekommer i nabo-optagelser.
22. Computer-implementeret fremgangsmåde ifølge krav 17, hvorved den sammensatte optagelse slettes, når en foruddefineret betingelse er opfyldt.
23. Computer-implementeret fremgangsmåde ifølge et hvilket som helst af kravene 1-22, hvorved feltet er konfigureret til at have en dimension på elleve ord anbragt ved siden af hinanden i en fortløbende tekst.
24. Computer-implementeret fremgangsmåde ifølge et hvilket som helst af kravene 1-23, hvorved feltet er konfigureret til at have en dimension svarende til bredden af dokumentet og højden af skrifttypestørrelsen af karaktererne.
25. Computer-implementeret fremgangsmåde ifølge et hvilket som helst af kravene 1-22, hvorved feltet er konfigureret til at have en dimension på mindre end fem gange størrelsen af den mindste karakter, som er underlagt karaktergenkendelse.
26. Computer-implementeret fremgangsmåde ifølge et hvilket som helst af kravene 1-25, hvorved mindst to optagelser erhverves samtidigt.
27. Computer-læsbart medium indkodet med et program, der implementerer fremgangsmåden ifølge et hvilket som helst af kravene 1-26, når det køres på en computer.
28. System omfattende en skanningsanordning og en computer loadet med et program, der implementerer fremgangsmåden ifølge en hvilken som helst af kravene 1-26, når programmet køres på computeren.
DK200800356A 2008-03-07 2008-03-07 Fremgangsmåde til skanning DK176834B1 (da)

Priority Applications (10)

Application Number Priority Date Filing Date Title
DK200800356A DK176834B1 (da) 2008-03-07 2008-03-07 Fremgangsmåde til skanning
PCT/EP2009/052616 WO2009109627A1 (en) 2008-03-07 2009-03-05 Method of scanning
BRPI0910255A BRPI0910255A2 (pt) 2008-03-07 2009-03-05 método de escaneamento
MX2010009615A MX2010009615A (es) 2008-03-07 2009-03-05 Metodo de exploracion.
US12/667,930 US8605297B2 (en) 2008-03-07 2009-03-05 Method of scanning to a field that covers a delimited area of a document repeatedly
JP2010549149A JP2011513850A (ja) 2008-03-07 2009-03-05 スキャンの方法
EA201071042A EA201071042A1 (ru) 2008-03-07 2009-03-05 Способ сканирования
CN200980108147XA CN101981569A (zh) 2008-03-07 2009-03-05 扫描方法
EP09716359A EP2260412A1 (en) 2008-03-07 2009-03-05 Method of scanning
CA2717378A CA2717378A1 (en) 2008-03-07 2009-03-05 Method of scanning

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DK200800356 2008-03-07
DK200800356A DK176834B1 (da) 2008-03-07 2008-03-07 Fremgangsmåde til skanning

Publications (2)

Publication Number Publication Date
DK200800356A true DK200800356A (da) 2009-09-08
DK176834B1 DK176834B1 (da) 2009-11-23

Family

ID=40138036

Family Applications (1)

Application Number Title Priority Date Filing Date
DK200800356A DK176834B1 (da) 2008-03-07 2008-03-07 Fremgangsmåde til skanning

Country Status (10)

Country Link
US (1) US8605297B2 (da)
EP (1) EP2260412A1 (da)
JP (1) JP2011513850A (da)
CN (1) CN101981569A (da)
BR (1) BRPI0910255A2 (da)
CA (1) CA2717378A1 (da)
DK (1) DK176834B1 (da)
EA (1) EA201071042A1 (da)
MX (1) MX2010009615A (da)
WO (1) WO2009109627A1 (da)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8798404B2 (en) * 2010-05-26 2014-08-05 Hin Leong Tan Making available to a user machine editable text extracted from an image
CN102385584A (zh) * 2010-08-31 2012-03-21 北大方正集团有限公司 剪报方法、装置及系统
DE102012025351B4 (de) * 2012-12-21 2020-12-24 Docuware Gmbh Verarbeitung eines elektronischen Dokuments
DE102014207874A1 (de) * 2014-04-25 2015-10-29 Siemens Aktiengesellschaft Verfahren zur automatisierten Erstellung eines eine technische Zeichnung charakterisierenden Datensatzes
US10235583B2 (en) * 2015-02-27 2019-03-19 Captricity, Inc. Electronically shredding a document
US11379753B1 (en) * 2017-04-24 2022-07-05 Cadence Design Systems, Inc. Systems and methods for command interpretation in an electronic design automation environment
JP7292988B2 (ja) * 2019-06-17 2023-06-19 キヤノン株式会社 情報処理装置、情報処理方法、及びプログラム
US12505280B2 (en) 2023-05-08 2025-12-23 Google Llc Tailored effects for text in social media and documents

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62106574A (ja) * 1985-11-05 1987-05-18 Hitachi Ltd 文書画像フアイル登録検索方式
US5109439A (en) * 1990-06-12 1992-04-28 Horst Froessl Mass document storage and retrieval system
JPH11306197A (ja) * 1998-04-24 1999-11-05 Canon Inc 画像処理装置及びその方法、コンピュータ可読メモリ
JP2000059588A (ja) * 1998-08-12 2000-02-25 Minolta Co Ltd 画像処理装置
GB2359953B (en) * 2000-03-03 2004-02-11 Hewlett Packard Co Improvements relating to image capture systems
IL154586A0 (en) * 2000-08-24 2003-09-17 Olive Software Inc System and method for automatic preparation and searching of scanned documents
US20050076013A1 (en) * 2003-10-01 2005-04-07 Fuji Xerox Co., Ltd. Context-based contact information retrieval systems and methods
JP2007122392A (ja) 2005-10-27 2007-05-17 Canon Inc 画像処理装置及び方法、並びにプログラム及び記憶媒体
JP4747828B2 (ja) * 2005-12-21 2011-08-17 富士ゼロックス株式会社 履歴管理装置
US20080021938A1 (en) * 2006-06-29 2008-01-24 Ashish Jha Technique for allocating objects in a managed run time environment
WO2008064378A1 (en) * 2006-11-21 2008-05-29 Cameron Telfer Howie A method of retrieving information from a digital image
US8209605B2 (en) * 2006-12-13 2012-06-26 Pado Metaware Ab Method and system for facilitating the examination of documents
DK176835B1 (da) * 2008-03-07 2009-11-23 Jala Aps Fremgangsmåde til skanning, medium indeholdende et program til udövelse af fremgangsmåden samt system til udövelse af fremgangsmåden

Also Published As

Publication number Publication date
MX2010009615A (es) 2011-02-24
BRPI0910255A2 (pt) 2015-09-29
US20100315688A1 (en) 2010-12-16
CN101981569A (zh) 2011-02-23
CA2717378A1 (en) 2009-09-11
WO2009109627A1 (en) 2009-09-11
US8605297B2 (en) 2013-12-10
JP2011513850A (ja) 2011-04-28
EA201071042A1 (ru) 2011-04-29
EP2260412A1 (en) 2010-12-15
DK176834B1 (da) 2009-11-23

Similar Documents

Publication Publication Date Title
DK200800356A (da) Fremgangsmåde til skanning
DK200800345A (da) Fremgangsmåde til skanning, medium indeholdende et program til udövelse af fremgangsmåden samt system til udövelse af fremgangsmåden
CN112527992A (zh) 长文本处理方法、相关设备及可读存储介质
CN109753987B (zh) 文件识别方法和特征提取方法
JP2010128941A5 (da)
CN107689070B (zh) 图表数据结构化提取方法、电子设备及计算机可读存储介质
CN107273883B (zh) 决策树模型训练方法、确定ocr结果中数据属性方法及装置
JP2014131277A5 (ja) 文書を表す二値画像を圧縮する方法及びプログラム
JP2010020468A5 (da)
US10373028B2 (en) Pattern recognition device, pattern recognition method, and computer program product
RU2015151699A (ru) Извлечение сущностей из текстов на естественном языке
JP6599672B2 (ja) 文字切り出し装置、文字認識装置、および文字切り出し方法
JP2010009509A5 (da)
Semenenko et al. Browserbite: Accurate cross-browser testing via machine learning over image features
CN113420122B (zh) 分析文本的方法、装置、设备及存储介质
CN111768405B (zh) 处理标注图像的方法、装置、设备和存储介质
JP2007183742A5 (da)
Palkovskii et al. Developing high-resolution universal multi-type n-gram plagiarism detector
JP7020331B2 (ja) クラスタリング装置、方法、及びプログラム
CN104298766B (zh) 一种清除SQLite数据库中数据的方法
CN106651972B (zh) 一种二值图像编码、解码方法及装置
IL185752A (en) Adjustable system and method for recognizing distorted text in computer images
Zheng et al. Deep learning-based species identification of gymnosperm xylem: The practice in digital forestry
JP4238902B2 (ja) 文字ノイズ除去装置、文字ノイズ除去方法、文字ノイズ除去プログラム
Gao et al. DSAN: double supervised network with attention mechanism for scene text recognition

Legal Events

Date Code Title Description
PBP Patent lapsed

Effective date: 20150331