TH111009A - วิธีการรู้จำตัวอักษรแบบปรับตัวได้ที่ใช้กับระบบแปลงภาพเอกสารเป็นข้อความ - Google Patents

วิธีการรู้จำตัวอักษรแบบปรับตัวได้ที่ใช้กับระบบแปลงภาพเอกสารเป็นข้อความ

Info

Publication number
TH111009A
TH111009A TH602001118F TH0602001118F TH111009A TH 111009 A TH111009 A TH 111009A TH 602001118 F TH602001118 F TH 602001118F TH 0602001118 F TH0602001118 F TH 0602001118F TH 111009 A TH111009 A TH 111009A
Authority
TH
Thailand
Prior art keywords
character recognition
documents
fonts
feature extraction
adaptive
Prior art date
Application number
TH602001118F
Other languages
English (en)
Other versions
TH93536B (th
TH93536S (th
Inventor
วัชรบุศราคำ นางสาวศรินทร์
ดูเบ นายเปรมนาถ
สินธุภิญโญ นายวศิน
มฤคทัต นายสรรพฤทธิ์
Original Assignee
นางสาวอรกนก พรรณรักษา
นางสาวอรุณศรี ศรีธนะอิทธิพล
นายชาญชัย นีรพัฒนกุล
สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ
Filing date
Publication date
Publication of TH93536S publication Critical patent/TH93536S/th
Application filed by นางสาวอรกนก พรรณรักษา, นางสาวอรุณศรี ศรีธนะอิทธิพล, นายชาญชัย นีรพัฒนกุล, สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ filed Critical นางสาวอรกนก พรรณรักษา
Publication of TH111009A publication Critical patent/TH111009A/th
Publication of TH93536B publication Critical patent/TH93536B/th

Links

Abstract

DC60 วิธีการรู้จำตัวอักษรแบบปรับตัวได้ที่ใช้กับระบบแปลงภาพเอกสารเป็นข้อความโดยที่ระบบมี ความสามารถที่จะปรับตัวเองให้สามารถรองรับเอกสารที่มีความหลากหลาย กับฟอนต์ที่ไม่เคยถูก สอนมาก่อน ให้สามารถทำงานได้อย่างถูกต้อง และระบบจะสามารถเรียนรู้ฟอนต์ใหม่โดยความ ช่วยเหลือของผู้ใช้เพียงเล็กน้อย ซึ่งจะมีประโยชน์ในการแปลงเอกสาร ไม่เฉพาะเอกสารเก่าเท่านั้น แต่รวมถึงเอกสารทั่วๆ ไปที่มีฟอนต์ที่แตกต่างออกไปจากฟอนต์ปกติ ระบบนี้จะเหมาะกับการใช้ งานในลักษณะที่เอกสารที่ต้องแปลงมีจำนวนมากและใช้ฟอนต์เดียวกัน ทำให้การเสียเวลาของผู้ใช้ ในการเตรียมระบบมีประโยชน์คุ้มค่า โดยกระบวนการของการรู้จำตัวอักษรแบบปรับตัวได้ที่เสนอ ได้แก่กระบวนการในระบบการแปลงเอกสารหลักๆ สองส่วนคือ การดึงลักษณะสำคัญและการรู้จำ ตัวอักษร โดยเทคนิคที่นำเสนอจะมีส่วนช่วยลดความซับซ้อนของเทคนิคเปรียบเทียบรูปแบบที่ใช้ กันในการรู้จำตัวอักษรแบบปรับตัวทั่วๆ ไป โดยได้เพิ่มความสามารถของส่วนการดึงลักษณะสำคัญ เป็นเทคนิคในการดึงลักษณะสำคัญของตัวอักษรแบบใหม่ ที่มีหัวใจหลักอยู่ที่แม่แบบของลักษณะ สำคัญ (Feature Template) ซึ่งสามารถจะมองได้ว่าเป็นเซตของลักษณะสำคัญมาตรฐานในแบบเชิง โครงสร้าง ที่มีไว้เพื่อใช้เป็นตัวแบบสำหรับบอกว่าลักษณะสำคัญใดๆ ที่เข้ามาทดสอบเป็น โครงสร้างลักษณะใดของตัวอักษร ซึ่งแม่แบบของลักษณะสำคัญ (Feature Template) จะช่วยให้การ หาโครงสร้างประกอบย่อยๆ ของตัวอักษรดังกล่าวง่ายขึ้น รวมทั้งช่วยทำให้การนำเสนอตัวอักษรให้ อยู่ในรูปแบบที่ง่ายแก่การรู้จำด้วย วิธีการรู้จำตัวอักษรแบบปรับตัวได้ที่ใช้กับระบบแปลงภาพเอกสารเป็นข้อความโดยที่ระบบมี ความสามารถที่จะปรับตัวเองให้สามารถรองรับเอกสารที่มีความหลากหลาย กับฟอนต์ที่ไม่เคยถูก สอนมาก่อน ให้สามารถทำงานได้อย่างถูกต้อง และระบบจะสามารถเรียนรู้ฟอนต์ใหม่โดยความ ช่วยเหลือของผู้ใช้เพียงเล็กน้อย ซึ่งจะมีประโยชน์ในการแปลงเอกสาร ไม่เฉพาะเอกสารเก่าเท่านั้น แต่รวมถึงเอกสารทั่วๆ ไปที่มีฟอนต์ที่แตกต่างออกไปจากฟอนต์ปกติ ระบบนี้จะเหมาะกับการใช้ งานในลักษณะที่เอกสารที่ต้องแปลงมีจำนวนมากและใช้ฟอนต์เดียวกัน ทำให้การเสียเวลาของผู้ใช้ ในการเตรียมระบบมีประโยชน์คุ้มค่า โดยกระบวนการของการรู้จำตัวอักษรแบบปรับตัวได้ที่เสนอ ได้แก่กระบวนการในระบบการแปลงเอกสารหลักๆ สองส่วนคือ การดึงลักษณะสำคัญและการรู้จำ ตัวอักษร โดยเทคนิคที่นำเสนอจะมีส่วนช่วยลดความซับซ้อนของเทคนิคเปรียบเทียบรูปแบบที่ใช้ กันในการรู้จำตัวอักษรแบบปรับตัวทั่วๆ ไป โดยได้เพิ่มความสามารถของส่วนการดึงลักษณะสำคัญ เป็นเทคนิคในการดึงลักษณะสำคัญของตัวอักษรแบบใหม่ ที่มีหัวใจหลักอยู่ที่แม่แบบของลักษณะ สำคัญ (Feature Template) ซึ่งสามารถจะมองได้ว่าเป็นเซตของลักษณะสำคัญมาตรฐานในแบบเชิง โครงสร้าง ที่มีไว้เพื่อใช้เป็นตัวแบบสำหรับบอกว่าลักษณะสำคัญใดๆ ที่เข้ามาทดสอบเป็น โครงสร้างลักษณะใดของตัวอักษร ซึ่งแม่แบบของลักษณะสำคัญ (Feature Template) จะช่วยให้การ หาโครงสร้างประกอบย่อยๆ ของตัวอักษรดังกล่าวง่ายขึ้น รวมทั้งช่วยให้การนำเสนอตัวอักษรให้ อยู่ในรูปแบบที่ง่ายแก่การรู้จำด้วย

Claims (1)

1. วิธีการรู้จำตัวอักษรแบบปรับตัวได้ที่ใช้กับระบบแปลงภาพเอกสารเป็นข้อความประกอบด้วย ขั้นตอน (สูตร) การรับข้อมูลภาพเอกสาร (สูตร) การแปลงภาพเอกสารเป็นภาพขาวดำสำหรับแยกตัวอักษรออกจากพื้นหลัง (สูตร) การดึงลักษณะสำคัญของโครงสร้างพื้นฐานของตัวอักษร (สูตร) การรู้จำตัวอักษรโดยการนำลักษณะสำคัญของตัวอักษรมาเปรียบเทียบกับ แม่แบบของ ลักษณะสำคัญ(Feature Template) ที่สร้างจากฐานข้อมูลตัวอักษรเพื่อหาตัวอักษรที่ใกล้เคียง (สูตร)แท็ก :
TH602001118F 2010-07-01 วิธีการรู้จำตัวอักษรแบบปรับตัวได้ที่ใช้กับระบบแปลงภาพเอกสารเป็นข้อความ TH93536B (th)

Publications (3)

Publication Number Publication Date
TH93536S TH93536S (th) 2009-02-20
TH111009A true TH111009A (th) 2011-11-21
TH93536B TH93536B (th) 2023-05-10

Family

ID=

Similar Documents

Publication Publication Date Title
JP2016146187A5 (th)
CN101840648B (zh) 自动盲文阅卷方法
CN108664474B (zh) 一种基于深度学习的简历解析方法
EP2746989A3 (en) Document processing device, image processing apparatus, document processing method and computer program product
CN101881999A (zh) 甲骨文视频输入系统及实现方法
JP2010182206A5 (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
Clausner et al. Efficient ocr training data generation with aletheia
CN110188750A (zh) 一种基于深度学习的自然场景图片文字识别方法
CN113901933B (zh) 基于人工智能的电子发票信息抽取方法、装置及设备
CN111092832A (zh) 莫尔斯电码深度学习训练数据制作方法
CN104820962B (zh) 一种代替人工签名栏的打印水印生成方法
CN104123527A (zh) 基于掩膜的图像表格文档识别方法
TW200425063A (en) Recognition method to integrate speech input and handwritten input, and system thereof
JP2006053920A (ja) 文字認識プログラム、文字認識方法および文字認識装置
CN102262731A (zh) 一种基于稀疏编码的字体识别方法
CN116958996A (zh) Ocr信息提取方法、系统及设备
CN102200966A (zh) 一种版面信息提取和加工的方法
CN112927566B (zh) 一种用于学生复述故事内容的系统及方法
TH111009A (th) วิธีการรู้จำตัวอักษรแบบปรับตัวได้ที่ใช้กับระบบแปลงภาพเอกสารเป็นข้อความ
CN114863446A (zh) 手写答案识别对比方法、装置、设备及存储介质
TH93536B (th) วิธีการรู้จำตัวอักษรแบบปรับตัวได้ที่ใช้กับระบบแปลงภาพเอกสารเป็นข้อความ
CN117746183A (zh) 图片标注方法、装置、设备以及存储介质
CN104834740A (zh) 一种全自动音视频结构化与精准搜索的方法
CN117932326A (zh) 一种利用pdf文本获取训练数据的方法、装置及电子设备
CN109409359A (zh) 一种基于深度学习的视频字幕提取方法