TH111009A - วิธีการรู้จำตัวอักษรแบบปรับตัวได้ที่ใช้กับระบบแปลงภาพเอกสารเป็นข้อความ - Google Patents
วิธีการรู้จำตัวอักษรแบบปรับตัวได้ที่ใช้กับระบบแปลงภาพเอกสารเป็นข้อความInfo
- Publication number
- TH111009A TH111009A TH602001118F TH0602001118F TH111009A TH 111009 A TH111009 A TH 111009A TH 602001118 F TH602001118 F TH 602001118F TH 0602001118 F TH0602001118 F TH 0602001118F TH 111009 A TH111009 A TH 111009A
- Authority
- TH
- Thailand
- Prior art keywords
- character recognition
- documents
- fonts
- feature extraction
- adaptive
- Prior art date
Links
Abstract
DC60 วิธีการรู้จำตัวอักษรแบบปรับตัวได้ที่ใช้กับระบบแปลงภาพเอกสารเป็นข้อความโดยที่ระบบมี ความสามารถที่จะปรับตัวเองให้สามารถรองรับเอกสารที่มีความหลากหลาย กับฟอนต์ที่ไม่เคยถูก สอนมาก่อน ให้สามารถทำงานได้อย่างถูกต้อง และระบบจะสามารถเรียนรู้ฟอนต์ใหม่โดยความ ช่วยเหลือของผู้ใช้เพียงเล็กน้อย ซึ่งจะมีประโยชน์ในการแปลงเอกสาร ไม่เฉพาะเอกสารเก่าเท่านั้น แต่รวมถึงเอกสารทั่วๆ ไปที่มีฟอนต์ที่แตกต่างออกไปจากฟอนต์ปกติ ระบบนี้จะเหมาะกับการใช้ งานในลักษณะที่เอกสารที่ต้องแปลงมีจำนวนมากและใช้ฟอนต์เดียวกัน ทำให้การเสียเวลาของผู้ใช้ ในการเตรียมระบบมีประโยชน์คุ้มค่า โดยกระบวนการของการรู้จำตัวอักษรแบบปรับตัวได้ที่เสนอ ได้แก่กระบวนการในระบบการแปลงเอกสารหลักๆ สองส่วนคือ การดึงลักษณะสำคัญและการรู้จำ ตัวอักษร โดยเทคนิคที่นำเสนอจะมีส่วนช่วยลดความซับซ้อนของเทคนิคเปรียบเทียบรูปแบบที่ใช้ กันในการรู้จำตัวอักษรแบบปรับตัวทั่วๆ ไป โดยได้เพิ่มความสามารถของส่วนการดึงลักษณะสำคัญ เป็นเทคนิคในการดึงลักษณะสำคัญของตัวอักษรแบบใหม่ ที่มีหัวใจหลักอยู่ที่แม่แบบของลักษณะ สำคัญ (Feature Template) ซึ่งสามารถจะมองได้ว่าเป็นเซตของลักษณะสำคัญมาตรฐานในแบบเชิง โครงสร้าง ที่มีไว้เพื่อใช้เป็นตัวแบบสำหรับบอกว่าลักษณะสำคัญใดๆ ที่เข้ามาทดสอบเป็น โครงสร้างลักษณะใดของตัวอักษร ซึ่งแม่แบบของลักษณะสำคัญ (Feature Template) จะช่วยให้การ หาโครงสร้างประกอบย่อยๆ ของตัวอักษรดังกล่าวง่ายขึ้น รวมทั้งช่วยทำให้การนำเสนอตัวอักษรให้ อยู่ในรูปแบบที่ง่ายแก่การรู้จำด้วย วิธีการรู้จำตัวอักษรแบบปรับตัวได้ที่ใช้กับระบบแปลงภาพเอกสารเป็นข้อความโดยที่ระบบมี ความสามารถที่จะปรับตัวเองให้สามารถรองรับเอกสารที่มีความหลากหลาย กับฟอนต์ที่ไม่เคยถูก สอนมาก่อน ให้สามารถทำงานได้อย่างถูกต้อง และระบบจะสามารถเรียนรู้ฟอนต์ใหม่โดยความ ช่วยเหลือของผู้ใช้เพียงเล็กน้อย ซึ่งจะมีประโยชน์ในการแปลงเอกสาร ไม่เฉพาะเอกสารเก่าเท่านั้น แต่รวมถึงเอกสารทั่วๆ ไปที่มีฟอนต์ที่แตกต่างออกไปจากฟอนต์ปกติ ระบบนี้จะเหมาะกับการใช้ งานในลักษณะที่เอกสารที่ต้องแปลงมีจำนวนมากและใช้ฟอนต์เดียวกัน ทำให้การเสียเวลาของผู้ใช้ ในการเตรียมระบบมีประโยชน์คุ้มค่า โดยกระบวนการของการรู้จำตัวอักษรแบบปรับตัวได้ที่เสนอ ได้แก่กระบวนการในระบบการแปลงเอกสารหลักๆ สองส่วนคือ การดึงลักษณะสำคัญและการรู้จำ ตัวอักษร โดยเทคนิคที่นำเสนอจะมีส่วนช่วยลดความซับซ้อนของเทคนิคเปรียบเทียบรูปแบบที่ใช้ กันในการรู้จำตัวอักษรแบบปรับตัวทั่วๆ ไป โดยได้เพิ่มความสามารถของส่วนการดึงลักษณะสำคัญ เป็นเทคนิคในการดึงลักษณะสำคัญของตัวอักษรแบบใหม่ ที่มีหัวใจหลักอยู่ที่แม่แบบของลักษณะ สำคัญ (Feature Template) ซึ่งสามารถจะมองได้ว่าเป็นเซตของลักษณะสำคัญมาตรฐานในแบบเชิง โครงสร้าง ที่มีไว้เพื่อใช้เป็นตัวแบบสำหรับบอกว่าลักษณะสำคัญใดๆ ที่เข้ามาทดสอบเป็น โครงสร้างลักษณะใดของตัวอักษร ซึ่งแม่แบบของลักษณะสำคัญ (Feature Template) จะช่วยให้การ หาโครงสร้างประกอบย่อยๆ ของตัวอักษรดังกล่าวง่ายขึ้น รวมทั้งช่วยให้การนำเสนอตัวอักษรให้ อยู่ในรูปแบบที่ง่ายแก่การรู้จำด้วย
Claims (1)
1. วิธีการรู้จำตัวอักษรแบบปรับตัวได้ที่ใช้กับระบบแปลงภาพเอกสารเป็นข้อความประกอบด้วย ขั้นตอน (สูตร) การรับข้อมูลภาพเอกสาร (สูตร) การแปลงภาพเอกสารเป็นภาพขาวดำสำหรับแยกตัวอักษรออกจากพื้นหลัง (สูตร) การดึงลักษณะสำคัญของโครงสร้างพื้นฐานของตัวอักษร (สูตร) การรู้จำตัวอักษรโดยการนำลักษณะสำคัญของตัวอักษรมาเปรียบเทียบกับ แม่แบบของ ลักษณะสำคัญ(Feature Template) ที่สร้างจากฐานข้อมูลตัวอักษรเพื่อหาตัวอักษรที่ใกล้เคียง (สูตร)แท็ก :
Publications (3)
| Publication Number | Publication Date |
|---|---|
| TH93536S TH93536S (th) | 2009-02-20 |
| TH111009A true TH111009A (th) | 2011-11-21 |
| TH93536B TH93536B (th) | 2023-05-10 |
Family
ID=
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2016146187A5 (th) | ||
| CN101840648B (zh) | 自动盲文阅卷方法 | |
| CN108664474B (zh) | 一种基于深度学习的简历解析方法 | |
| EP2746989A3 (en) | Document processing device, image processing apparatus, document processing method and computer program product | |
| CN101881999A (zh) | 甲骨文视频输入系统及实现方法 | |
| JP2010182206A5 (ja) | 画像処理装置、画像処理方法、プログラムおよび記録媒体 | |
| Clausner et al. | Efficient ocr training data generation with aletheia | |
| CN110188750A (zh) | 一种基于深度学习的自然场景图片文字识别方法 | |
| CN113901933B (zh) | 基于人工智能的电子发票信息抽取方法、装置及设备 | |
| CN111092832A (zh) | 莫尔斯电码深度学习训练数据制作方法 | |
| CN104820962B (zh) | 一种代替人工签名栏的打印水印生成方法 | |
| CN104123527A (zh) | 基于掩膜的图像表格文档识别方法 | |
| TW200425063A (en) | Recognition method to integrate speech input and handwritten input, and system thereof | |
| JP2006053920A (ja) | 文字認識プログラム、文字認識方法および文字認識装置 | |
| CN102262731A (zh) | 一种基于稀疏编码的字体识别方法 | |
| CN116958996A (zh) | Ocr信息提取方法、系统及设备 | |
| CN102200966A (zh) | 一种版面信息提取和加工的方法 | |
| CN112927566B (zh) | 一种用于学生复述故事内容的系统及方法 | |
| TH111009A (th) | วิธีการรู้จำตัวอักษรแบบปรับตัวได้ที่ใช้กับระบบแปลงภาพเอกสารเป็นข้อความ | |
| CN114863446A (zh) | 手写答案识别对比方法、装置、设备及存储介质 | |
| TH93536B (th) | วิธีการรู้จำตัวอักษรแบบปรับตัวได้ที่ใช้กับระบบแปลงภาพเอกสารเป็นข้อความ | |
| CN117746183A (zh) | 图片标注方法、装置、设备以及存储介质 | |
| CN104834740A (zh) | 一种全自动音视频结构化与精准搜索的方法 | |
| CN117932326A (zh) | 一种利用pdf文本获取训练数据的方法、装置及电子设备 | |
| CN109409359A (zh) | 一种基于深度学习的视频字幕提取方法 |