TW434496B - Intelligent photographic reading device and its operation method - Google Patents
Intelligent photographic reading device and its operation method Download PDFInfo
- Publication number
- TW434496B TW434496B TW86108364A TW86108364A TW434496B TW 434496 B TW434496 B TW 434496B TW 86108364 A TW86108364 A TW 86108364A TW 86108364 A TW86108364 A TW 86108364A TW 434496 B TW434496 B TW 434496B
- Authority
- TW
- Taiwan
- Prior art keywords
- image
- photographic
- reading device
- aforementioned
- scope
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000004891 communication Methods 0.000 claims abstract description 23
- 230000005540 biological transmission Effects 0.000 claims abstract description 19
- 230000003287 optical effect Effects 0.000 claims abstract description 12
- 238000006243 chemical reaction Methods 0.000 claims abstract description 6
- 238000001914 filtration Methods 0.000 claims abstract description 6
- 238000012545 processing Methods 0.000 claims description 17
- 235000015170 shellfish Nutrition 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 8
- 238000005516 engineering process Methods 0.000 claims description 5
- 239000003990 capacitor Substances 0.000 claims description 4
- 230000002079 cooperative effect Effects 0.000 claims description 4
- 238000003384 imaging method Methods 0.000 claims description 2
- PCTMTFRHKVHKIS-BMFZQQSSSA-N (1s,3r,4e,6e,8e,10e,12e,14e,16e,18s,19r,20r,21s,25r,27r,30r,31r,33s,35r,37s,38r)-3-[(2r,3s,4s,5s,6r)-4-amino-3,5-dihydroxy-6-methyloxan-2-yl]oxy-19,25,27,30,31,33,35,37-octahydroxy-18,20,21-trimethyl-23-oxo-22,39-dioxabicyclo[33.3.1]nonatriaconta-4,6,8,10 Chemical compound C1C=C2C[C@@H](OS(O)(=O)=O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2.O[C@H]1[C@@H](N)[C@H](O)[C@@H](C)O[C@H]1O[C@H]1/C=C/C=C/C=C/C=C/C=C/C=C/C=C/[C@H](C)[C@@H](O)[C@@H](C)[C@H](C)OC(=O)C[C@H](O)C[C@H](O)CC[C@@H](O)[C@H](O)C[C@H](O)C[C@](O)(C[C@H](O)[C@H]2C(O)=O)O[C@H]2C1 PCTMTFRHKVHKIS-BMFZQQSSSA-N 0.000 claims 1
- 238000009434 installation Methods 0.000 claims 1
- 230000003068 static effect Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000012015 optical character recognition Methods 0.000 description 3
- 238000007639 printing Methods 0.000 description 3
- 230000000875 corresponding effect Effects 0.000 description 2
- 241000255925 Diptera Species 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
Landscapes
- Character Discrimination (AREA)
- Character Input (AREA)
Description
經濟部中央揉率局負工消費合作社印家 4344 96 五、發明説明(1) --- 本發明係有關於-種資料輸人裝置,特別係有關於 一種攝影式智慧閱讀裝置及其操作方法。 按現今之開放社會,媒體資訊日益發達,尤以報紙、 雜諸、書刊為最’大4的新資訊時常給_者造成理解 上的困難,如此,查詢相關字彙的資料或解釋已迫在眉 睫。按以往常見的方法,—般是搬來沉重的字典進行手 工查閱,以達理解的目的。此方法費時費力如遇一篇 資訊材料有多處生僻字彙,則勢必降低閱讀速度,且分 散閱讀者的注意力。 於是,近來出現了許多電腦字彙翻譯軟體,來取代 部份或全部字惫解釋之功能《惟目前所發展出來的字彙 翻譯軟體,在解釋印刷體字彙時,均需將其經由鍵盤或 筆式鍵入的動作來達到輸入的目的,雖省卻人為查閱字 典的步驟,但增加了鍵入字彙的動作’如遇較長的字彙, 速度反不及手工查閲,且鍵入過程中難免發生拼寫錯 誤,使用者常需修改,異常頻繁,極易擾亂閲讀思路, 影響閱讀效果,實為得不償失。 有鑑於此’本發明之目的即在於克服印刷體字彙翻 譯快速性與便利性之矛盾,結合電子技術及程式設計, 提供一攝影式閱讀裝置。此種攝影式閱讀裝置係包含有 一個二維CCD或CMOS光影像感應裝置(CMOS image sensor module) ’其操作步驟及内部控制流程為:(1)首先 使用者將攝影式閱讀與主電腦裝置經由高速傳輸纜線連 接’再將攝影式閱讀裝置之前端透鏡對準待查詢之印刷 3 本紙張尺度適用中國國家標準(CNS ) A4規格(210X297公廣) ^1訂 ^ (請先閲讀背面之注意事項再填寫本頁} 經濟部中央標率局貝工消費合作社印装 4344 96 Λ7 B7____ 五、發明説明(2 ) 體文字或片語,按動採集開關,經由光攝影透鏡擷取該 文字影像的光信號,同時並傳送至攝影式閱讀裝置内的 影像感應裝置(CCD或CMOS影像感應裝置);(2)在前述 影像感應裝置内部,攝像驅動器(image driver)經由數位 信號處理器控制,以驅動影像感應器將光信號轉換成類 比電信號,再通過類比/數位轉換器轉換成數位影像信 號,然後再傳送至數位信號處理器中,經濾波處理後, 將可以辨識的信號傳送至攝影式閱讀裝置的通訊控制界 面卡(communication interface controller) ; (3)信號自攝影 式閱讀裝置的通訊控制界面卡經高速數據傳輸纜線與主 電腦裝置的通訊控制界面卡相連接,連接的通訊埠可為 串行埠、平行埠、PCMCIA(PC Memory Card International Association)或USB ; (4)接著,主電腦裝置將數位影像信 號轉換成影像陣列(digital image data matrix)文件,利用 OCR (Optical Character Recognition)技術對此影像陣列辨 識,得出文本關鍵詞(Text Headword),輸入資料庫查詢 系統(Database Searching System)查詢得到所需之相關資 料(如解釋文字、聲音、影像等),並同時將之顯示於主電 腦裝置的顯示器(display心¥。6)上。 本發明之一優點在於利用攝影透鏡結合影像感應裝 置製成之攝影式閱讀,具有體積小、使用靈活等特點, 將其應用於印一體文字之影像輸入,便於操作。 本發明之另一個優點在於本裝置提供了印刷體文字 之線上即時辨識、即時查詢、即時顯示的功能,實現閱 本纸張尺度適用肀SS家標率(CNS > A4規格(2丨0X297公釐) I 裝 訂 咸 (請先閲讀背面之注意事項再填寫本頁)
4344 -S 經濟部中央搮率局貝工消費合作社印裝 A7 五、發明説明(3 ) 讀與理解同步的過程,大幅地提升閱讀者的閱讀速度。 本發明之再一優點為利用此裝置之軟、硬體,可方 便而且即時地完成在個人電腦、手持式個人電腦 (Handheld Personal Computer)或電子字典上對印刷體文 字之自動輸入。 為了進一步說明本發明之架構、操作方式及特點, 下面就配合附圓說明本發明之較佳實施例’其中: 第1圖係繪示本發明之攝影式智慧閱讀裝置的架構 圖式; 第2圖係繪示本發明之攝影式智慧閱讀裝置的閱讀 裝置架構之方塊圖; 第3圖係繪示應用於第2圖之攝影式閱讀裝置的影 像感測器電路圖; 第4圖係繪示本發明之攝影式智慧閱讀裝置的主電 腦裝置架構之方塊圖; 第5圖係繪示本發明中攝影式閱讀裝置擷取文字影 像的流程圖; 第6圖係緣示本發明中主電腦裝置處理文字影像的 流程圖; 第7圖係緣示本發对主電腦裝置進行文字影像辨 識的流程囷; 第8圖係㈣本發财對文字影像進行框架處理的 7F意圖, 第9圖係_示在本發明的字元辨識程序中特徵像素 I ^IT.^-(請先閲讀背面之注意事項再填寫本頁)
434496 經濟部中央樣率局貝工消費合作社印装 A7 B7 立、發明説明(4) 選取方式的示意圖; 第10圖係繪示本發明的循環辨識程序中進行匹配判 別的流程圖; 第11圖係繪示對資料庫進行關鍵詞查詢動作的流程 圖。 實施例之說明 本發明利用攝影式閱讀裝置(内含一個二維CCD或 CMOS製程元件之光影像感測裝置),將書本、雜誌上之 印刷體文字影像通過攝影式閱讀裝置前端之透鏡(lens) 傳入攝影式閱讀裝置内影像感測裝置,經類比/數位(A/D) 轉換後,利用數位信號處理(DSP)技術將影像濾波,並同 時透過高速傳輸線路傳至主電腦裝置,利用〇CR技術辨 識出文本關鍵詞’輸入資料庫查詢系統查詢得到所需相 關資料(如解釋文字、聲音、影像等),並同時將之顯示於 主電腦裝置的顯示器(display device)上。 本發明之裱影式智慧閲讀裝置的硬體架構說明如 下。首先’請參閱第1圖’本發明之攝影式智慧閱讀裝 置係包括:一攝影式閱讀裝置10,作為影像攝入裝置, 用以攝入文數字、條碼、影像;一主電腦裝置12,作為 整個系統的控制核心;及一高速數據傳輸纜線14,連接 前述攝影式閱讀裝置10及主電腦裝置12,用以傳輸影 像資料。當攝影式閱讀裝置10攝入影像後,經由高速數 據傳輸纜線14將影像資料傳輸給主電腦裝置12,藉以 提供不同應用之所需。例如,當主電腦裝置12為一電子 本紙張尺度適用中國困家橾隼(CNS > A4規格(210X297公釐) (請先閲請背面之注意事項再填寫本頁) 、νβ 434496 經濟部中央標率局貞工消费合作社印製 A7 B7 五、發明説明(5) 字典,則在攝影式閱讀裝置10經高速數據傳輪纜線14 輸入字元、單字或片語的影像資料後,主電腦裝置12會 顯示出該字元、單字或片語的相關資料β 請參閱第2圖,本發明之攝影式智慧閱讀裝置的攝 影式閱讀裝置10係經由高速數據傳輸纜線14連接至通 訊控制介面30 ’再經由通訊控制介面30將資料輸入給 主電腦裝置12。前述攝影式閲讀裝置10係包括:一光 攝影透鏡16 ’作為文字影像的成像裝置;一開關μ ; 一二維影像感應器(Image sensor)20 ,例如一 CCD或 CMOS影像感測器’用以接收經前述光攝影透鏡16成像 之文字影像的光信號,並將光信號轉換成類比電信號; 一類比數位(A/D)轉換器22 ,用以將由前述影像感應器 獲得之類比信號轉換為數位信號;一數位信號處理器 (DSP)24 ’用以受前述開關18控制,可接收經前述類比 數位轉換器22輸出之數位影像訊號,對該數位影像訊號 進行遽波處理;一記憶裝置26,可為隨機存取記憶體 (RAM)及唯讀記憶體(ROM),其中,唯讀記憶體是用以儲 存控制數位信號處理器24操作所需之程式,而隨機存取 記憶體則是用於影像感應器20及數位信號處理器24的 一般操作中。 前述攝影式閱讀裝置10可自印刷品28上擷取影 像。前述攝影式閱讀裝置10的透鏡16置於其前端,且 透鏡16的設計最好能配合使用者使用的方式,同時提供 給物端(即印刷品28)較長的景深。 本紙張尺度適用t國國家標隼(CNS) A4堤格(210X297公釐) ----------^— (請先閲讀背面之注意事項#填寫本頁) 訂 4 A7 B7 6 五、發明説明( 前述高速數據傳輸缆線14可為一平行埠傳輸獲線, 用以連接至主電腦裝置的平行皡。或可為一串行蜂傳輸 纜線,用以連接至主電腦裝置的串行埠。或者,亦可為 符合通用串列匯流排(universal serial bus,簡稱USB)協 定’或 PCMCIA(PC Memory Card International Association) 或PC卡標準的.通訊方式之镜線。當然,傳輪的方式若是 為了要避免使用纜線’也可以採用無線或是紅外線的方 式β 前述開關18可為一即時開關,也就是當使用者按著 開關18時’攝影式閱讀裝置10便持續地讀入影像,而 在使用者放開開關18時’攝取一靜態影像。或者,開關 18亦可為一般的按鍵開關’當開關μ開啟時,便攝取影 像’當開關18關閉時,便停止攝取影像9 前述影像感應器20係受一影像感測驅動裝置控制, 以將擷取到的影像轉換成類比影像訊號。而在本實施例 中’前述影像感測驅動裴置係儲存於記憶裝置26中的程 式指令,此程式指令同時亦控制前述數位信號處理器24 的運作。 前述數位仏號處理器24為整個攝影式閱讀裝置的控 制核心,在本實施例中可為微處理器、微電腦、微控制 器或RISC處理器等’其主要動作如下:(1)受開關丨^控 制接收影像訊號;(2)對類比數位轉換器22輸出之數位影 像信號進行濾波處理,即去除信號之失真部份,同時進 行影像信號之邊緣定位,結構加強及平滑處理,藉以得 木紙張尺度適用中國國家橾準(CNS } A4規格(2丨0X297公着 ---------^------ir------^ (請先聞讀背面之注意事項再填寫本頁) 經濟部中央標準局—工消費合作社印裝 434496 經濟部中央標準局貝工消费合作社印笨 A7 B7 五、發明説明(7) 到較為理想的數位影像信號;(3)將數位影像信號轉換為 主電腦裝置可識別之圖像數位信號,傳至通信控制介面 30 - 請參閱第3圖’前述影像感應器(image sensor)係包 括.一影像感測電路34,及一移位暫存器(CCD analog shift register)44 ,經由一移位閘 42(shift gate)與前述影像 感測電路34連接。前述影像感測電路34係包括排列成 一維矩陣型式的複數個光感測元件,且每一個光感測元 件係包括:並聯的一光電二極管(ph〇t〇doide)36及一電容 器38,且其一端接地40。其具體運作方式為:光影像 信號傳入光電二極管36後,經其光電感應過程轉變為一 信號電荷(signal charge),並將之存於電容器38中,再經 移位閘42傳至移位暫存器44中,轉換為類比影像信號 (analog image signal)。前述光電二極管36可用一光阻器 (photo resistor)取代,而移位暫存器44亦可採用CM〇s 製程之類比移位暫存器。 請參閱第4圖,本發明之攝影式智慧閱讀裝置的主 電腦裝置12係包括:一處理單元46,為整個系統的控 制核心,可為CISC或RISC處理器,用以執行〇CR文字 辨識命令及字彙查詢命令;一顯示裝置48,受前述處理 單元46控制,藉以顯示自該處理單元46輸出的資訊。 前述處理單元46經由匯流排50連接至至少一記憶裝置 52,至少一儲存裝置54,及通訊控制介面3〇。 前述記憶裝置52可包括隨機存取記憶體及唯讀記憶 ----------¢------1T------^ (請先閱讀背面之注意事項再填寫本頁) 434496 A 7 B7 經濟部中央輮準局貝工消费合作社印«. 五、發明説明(8) 體。而前述儲存裝置54則依據主電腦裝置的不同型式, 而可為軟碟 '硬碟、光碟、記憶體或PCMCIA記憶卡等》 例如,在一電子字典中,單字及片語的定義及相關資訊 便可儲存於儲存裝置54中。在本發明中,影像辨識及資 料庫查詢的應用程式也可儲存在儲存裝置54中。前述通 訊控制界面30,可經由平行埠(parallel port)、串行埠 (serial port)或通用串列匯流排(universal serialbus ’ 簡稱 USB)連接於前述高速數據傳輸纜線14。 請參閱第5圖,其係繪示攝影式閱讀裝置擷取影像 的流程,包括下列步驟:(1)步驟60 ’決定使用者是否將 攝影式閱讀裝置對準待辨識之印刷髅文字或片語’按動 採集開關,若無則回到啟始,否則進行下一步驟;(2)步 驟62,經由光攝影透鏡16擷取影像的光信號,同時經 由影像感應器20產生矩陣格式的類比影像信號;(3)步驟 64,前述類比影像信號通過類比/數位轉換器22轉換成 數位影像信號,然後再傳送至數位信號處理器24中;(4) 步驟66,經數位信號處理器對數位影像信號進行濾波處 理及對應的信號轉換,並將處理後之影像資料陣列(image data matrix)傳送至攝影式閱讀裝置的通訊控制界面 (communication interface controller) ; (5)步驟 68,攝影 式閱讀裝置的通訊控制界面將影像資料陣列經高速數據 傳輸纜線傳輸至主電腦裝置的通訊控制界面,連接通訊 控制界面的通訊埠可為串行埠、平行埠、PCMCIA(PC Memory Card International Association)或 USB 等,然後 ίο (請先閲讀背面之注意事項再填寫本頁) .裝- 本紙張尺度適用中國國家標準(CNS ) Α4規格(210Χ297公釐) 經濟部中央橾率爲貝工消费合作社印装 434496 A7 B7 ______ 五、發明説明(9 ) 再回到啟始,決定是否再擷取影像。 請參閱第6圖,其繪示主電腦裝置的操作流程’包 括下列步驟:(1)步驟70,決定主電腦裝置是否自攝影式 閱讀裝置讀取影像資料陣列,若無則回到啟始’否則進 行下一步驟;(2)步驟72,處理單元開始進行字元辨識程 序;(3)步驟74,進行資料庫查詢程序;(4)步驟76,依 據查詢結果,自資料庫中擷取相關資訊;(5)步驟78 ’將 查詢得到所需之相關資訊(如解釋文字、聲音、影像等) 顯示於主電腦孝置的顯示器(display device)上。 請參閱第7圖,前述字元辨識程序的流程主要是包 括下列步驟··(1)步驟80,經由攝影式閱讀裝置讀取影像 資料,並將其以陣列的形式儲存於主電腦裝置的RAM 申;(2)步驟82 ,將影像資料陣列之多級灰度格式 (multi-gray format)或彩色格式(color image format)轉化 成二級灰度格式(binary-gray format) ’即以0與1表示像 素之有無,藉以區分文字與背景影像,以便於影像辨識; (3)步驟84,根據各像素之稀疏綢密特徵,進行二值化的 影像陣列所具有的雜訊過濾,去除一些特別稀疏的雜 點,使待辨識之影像點陣整齊、清晰;(4)步驟86,將點 陣影像依據其點陣疏密(point density),將其區分為多塊 片語影像(word image blocks)和多塊字元影像(character image blocks) ’以便於單個字元的辨識;(5)步称88,進 行字元或片語影_像循環辨識程序;(6)步驟,決定是否 辨識下一個字元或片語,若是則回到啟始,否則辨 11 本紙目轉奉(CNS) ( 210x297公着)" ----- n n - n I ! I ^ 旅 (請先聞讀背面之注意事項再填寫本頁) 經濟部中央梯準局貝工消費合作社印^ 4 3^4 96 A7 B7 Γ — - ...... " ------- 五、發明説明(1Q ) 識。 在前述步驟80中’由攝影式閱讀裝置輪入主電腦裝 置的影像資料陣列,格式函數為Pmn(Xm Yn),其中,(Xm Yn) 為像素的座標位置,Pmn(Xm,Yn)為該像素的影像多階灰 度值。
PiiOi,yi) P2iCx2,yi) P3l(X3,yi) Pftn- Ϊ、1 (Xfn-1,Y i) P_ ιίχ Vi、 Pl2(Xl,Y2) P22(X2,y2) P32(X3,ya p v-i^ * · · · » Pln(Xl,yn) P2n(X2,yn) P3n(X3,yn) P(m-1 }(π· 1 )(Xm,1,yn-l) Pmn(xm,yn) 在前述步驟86中,經過濾波處理過的影像資料陣 列,利用影像分離與連續之特徵,切割成各個獨立字元 的影像’此即為“框架處理,,(framingpr〇ces〇。 各個獨立之字元影像陣列分別以gi,以,^ ^ 表示,請參閱第8圖’以“BIZ”為例,其經切分後,“B” 的影像區塊以g,表示,“I”的影像區塊以g2表示,而“z„ 的影像區塊以g3表示。函數R(G)為影像循環辨識函數, 將m個獨立影像塊gl、g2、g3 ‘ ..、心代入R(G)得 R(gi、g2、g3 . . .、gt),可辨識得相對應的字元ei、 e2、以.· ·、et ’循序儲存於數組E中,數組E即為 辨識所得之關鍵詞。 前述影像循環辨識函數R(G)所採用的字元辨識方法 基本上為匹配判別。請參閱第9圖,以印刷體的“Z”為例, 其具有的筆段(stroke)為S-1 92、S-2 94及S-3 96 ,首先 12 ----------装------iT------Λ (請先閲讀背面之注意事項再填寫本頁) 本紙張尺度適用十國國家榡準{〇^/114说格(2〗〇\297公釐) 經濟部中央標率局貝工消費合作社印製 434496 A7 ____B7 五、發明説明(u ) 決定每-筆段的相對長度,在本财,S 2 94較長,而 S-192及S-396則等長;接著決定字元影像的筆段數目, 以本例而言,共有三個筆段;決定每—筆段的方向在 本例中,S-192及S-3 96均為水平方向,s_2 94為右上 至左下的方向;最後再決定字元影像的連接點數目,在 本例中為一。然後,根據上述步驟所得到的特徵資訊, 於資料庫查詢的程序中,再與字元特徵庫中的每一個字 元的特徵減較。前述字元賴料預先时於資料庫 中,所以本發明之字元辨識,依據内建範本不同,除了 可辨識各種不同的文字、數字外,尚可應用於辨識影像。 為了更進一步說明影像循環辨識,請參閱第1〇園, 其缘示在步驟88中时元或片語影像循環辨識程序的流 程’包括下列步驟⑴步驟⑽’識別字元影像的筆段; (2)步驟102,決定字元影像的筆段數目;⑺步驟1〇3, 決定每-筆段_對長度;⑷㈣⑽,決定相連接筆 段間的角度U5)㈣105,決定每一筆段的方向;(6)步 驟106 ’根據上述步驟取得字元的特徵資訊;⑺步驟 108,將每-個字元像素的特徵與字元特徵庫中的每一個 字元影像的特徵相比:(8)步称110,是否找到特徵相匹 配的字元,若是則進行至步称112,否則進行至步称114; ⑼步驟112,使用在子元特徵庫中找到的字元做為參考 字70碼;(10)步驟114,使用在字元特徵庫中找到特徵最 接近的字元做為參考字元碼。 請參閱第11圖,其繪示對關鍵詞進行查詢動作的流 13 本紙張从逍用帽@家揉準(CNS)舢祕(21gx297公廣) ----------^------ΐτ------4. (諳先閲讀背面之注意事項再填寫本頁) 五、發明説明(12 程’包括下列步驟:(I)步騍 識轉換後的文本關鍵詞;(2)步驟;i8 經辨 文本關:詞與資料庫中既有的資料進行—比較資= 120,蚊是否找到相符的資料,若是,則進行至步: 124,否則進行至步驟126 ;⑷步驟12 ::步驟 取此關鍵詞的相關資訊;(5)步 料庫中獲 畏接折的相關咨π . 止 獲取與此關鍵詞 ! 50’將獲取的相關資訊顯 不於液晶顯示器上。 只叫湖 前述步驟250中,在杳詢眘姐虑& 資降了宝分資料庫後’所獲取的相關 資訊除了予凡、早子或片語的定義與說明外, 侷限於文字的資料,而是可包括 1 媒體資料。 子tw象、聲音等多 在上述的實施例中,主電腦裝置可為任何包含有微 處理器的裝置’如個人電蹈、手持式個人電腦或電子 字典,例如英業達股份有限公司生產的無敵CD 腦閱讀辭典等。 I 裝------Λ1Τ------^ (請先閲讀背面之注項再填寫本頁) 經濟部中央標準局貝工消費合作社印装 本紙張尺度適用中國固家標率(CNS )八4規格(210X297公釐)
Claims (1)
- 經濟部中央揉率局員工消費合作社印製 h一種攝影式智慧閱讀裝置,包括: 攝影式閱讀裝置,用以輸入影像信號; 发一主電腦裝置,用以接收前述攝影式閱讀裝置輸入 =衫像信號,對該影像加以辨識,並根據辨識結果查詢 料庫’然後自資料庫中擷取並輪出與該辨識結果相關 的資料; 高速數據傳輸纜線,連接前述攝影式閱讀裝置及 主電腦裝置,用以傳輸影像信號。 2. 如申請專利範圍第1項的攝影式智慧閱讀裝置,其 中’前述攝影式閱讀裝置係包括: —光攝影透鏡’作為影像的成像裝置; 一開關; 一二維影像感應器,用以接收經前述光攝影透鏡成 像之影像的光信號,並將光信號轉換成類比電信號; 一類比數位轉換器,用以將由前述影像感應器獲得 之類比信號轉換為數位信號; 數位信破處理器,用以受前述開關控制,可接收 經前述類比數,位轉換器輸出之數位影像訊號,對該數位 影像訊號進行濾波處理; 一記憶裝置’用以儲存控制數位信號處理器操作所 需之程式,及用於影像感應器及數位信號處理器的—般 操作中。 3. 如申請專利範圍第1項的攝影式智慧閱讀裝置, 其中,前述主電腦裝置係包括: 本紙張尺度逋用中國國家梯準(CNS > A4規格(210 X 297公嫠) I.--;------—裝-----i订------冰 (請先閲讀背面之注意事項再填寫本頁) 434496 ABCD 經濟部中央棣準局員工消費合作社印裝 申請專利範圍 一處理單元’用以執行影像辨識及資料庫查詢動 作同時經由匯流排連接至至少一記憶裝置,至少一儲 存裝置’及通訊控制介面; 一顯示裝置,受前述處理單元控制,藉以顯示自該 處理單元輸出的資訊。 4. 如申請專利範圍第1項的攝影式智慧閱讀裝置,其 中,前述高速數據傳輸纜線與前述主電腦裝置間的連接 埠可為平行埠、串行埠、符合通用串列匯流排協定,或 PCMCIA或pc卡標準的通訊埠。 5. 如申請專利範圍第2項的攝影式智慧閱讀裝置,其 中’前述影像感應器係包括: 一影像感測電路;及 一移位暫存器,經由一移位閘與前述影像感測電路 連接。 6_如申請專利範圍第2項的攝影式智慧閱讀裝置,其 中,前述影像感應裝置係包括CXD及利用CMOS技術製 作的電路元件。 7. 如申請_利範圍第3項的攝影式智慧閱讀裝置,其 中’前述處理單元可為CISC或RISC處理器。 8. 如申請專利範圍第3項的攝影式智慧閱讀裝置,其 中,前述記憶裝置可為隨機存取記憶體及唯讀記憶體。 9. 如申請專利範圍第3項的攝影式智慧閱讀裝置,其 中’前述儲存裝置可為軟碟、硬碟、光碟、記憶體或 PCMCIA記憶卡等。 本紙浪尺度逋用中國國家標準(CNS ) A4規格(210X297公釐) --------—裝------訂 C请先聞讀背面之注意事項再填寫本頁) 434496 A8 B8 C8 D8 經濟部中央梯率局貝工消費合作社印装 六、申請專利範圍 1〇_=申請專利範圍第5項的攝影式智慧閱讀裝置, 其中别述影像感測電路係包括排列成二維矩陣型式的 複數個光感測元件,且每一個光感測元件係包括並聯的 —光電二極管及一電容器,且其一端接地。 11.如申請專利範圍第5項的攝影式智慧閱讀裝置, 其中,前述移位暫存器可為一 CCD類比移位暫存器或 CMOS製程之類比移位暫存器。 12·如申請專利範圍第7項的攝影式智慧閱讀裝置, 其中,前述主電腦裝置可為個人電腦、手持式個人電腦、 或電子字典。 13. —種攝影式智慧閱讀裝置的操作方法,包括下列 步驟: (i)备使用者按動採集開關時,經由攝影式閱讀裝置 棟取物體影像並產生數位影像訊號; (ii)將該影像訊號傳送至主電腦裝置; (ill)由主電腦裝置對該影像訊號進行辨識同時根據 辨識結果進行資料庫查詢; (iv)自資料庫中掏取與辨識結果最接近的相關資訊, 並加以顯示。 14. 如申請專利範圍第13項的操作方法,其中,在前 述步驟⑴,當使用者按動採集開關,攝影式閱讀裝置會 連續地擷取物體影像並產生影像訊號,而當使用者放開 開關時’才擷取一靜態影像進行辨識。 15. 如申請專利範圍第π項的操作方法,其中,在前 17 本紙浪尺度通用中國國家標準(CNS ) A4規格(210X297公釐} ---------—t-------IT (請先閲讀背面之注意事項再填寫本頁) 經濟部中央梯率局貝工消費合作社印装 434496 A8 B8 C8 ~、--— _^___ 六、申請專利範圍 述步驟⑴,當使用者按動採集開關,攝影式閱讀裝置會 擷取物體影像並產生影像訊號。 16.如申請專利範圍第13項的操作方法,其中,在前 述步驟(iii) ’主電腦裝置進行影像辨識的程序係包括下列 步驟: (i)經由閱讀裝置讀取影像資料,並將其以陣列的形 式儲存於主電腦裝置的RAM中; (π)將影像資料陣列之多級灰度格式或彩色格式轉 化成二級灰度格式’藉以區分圖案與背景影像,以便於 影像辨識; (出)根據各像素之稀疏調密特徵’進行二值化的影像 陣列所具有的雜訊過濾,使待辨識之影像點陣整齊清 晰; (iv) 將點陣影像依據其點陣疏密,進行切分以便於 辨識; (v) 進行影像循環辨識程序。 17,如申請專利範圍第13項的操作方法,其中,在前 述步驟(iii),主電腦裝置進行資料庫查詢的程序係包括下 列步驟: ⑴自記憶體中讀取經辨識轉換後的圖案之特徵像 素; ⑼查詢資料庫’將特徵像素與資料料既有的資料 進行比較; ⑽決定是否找到相符的資料,若是,則從資料庫中 11H I I I n 11 (請先閲讀背面之注意事項再填寫本1) 18434496 A8 B8 C8 _ D8 六、申請專利範圍 獲取此相關資訊,否則獲取最接近的相關資訊。 18.如申請專利範圍第13項的操作方法,其中,前述 影像可為文數字、條碼及影像等。 n t^i ^^1 I— —ϊ— I n I. n In n ί ... ' X (請先w讀背面之注$項再填寫本頁) 19·如申請專利範圍第13項的操作方法,其中,前述 與辨識結果最接近的相關資訊可包括文字、影像、聲音 等多媒體資料。 20,一種攝影式智慧閱讀裝置的操作方法,包括下列 步驟: ⑴使用者將一攝影式閱讀裝置對準待辨識之印刷體 文字或片語,按動採集開關,文字影像經由光攝影透鏡 操取’同時並傳送至一影像感應器; (Π)前述影像感應器將光信號轉換成類比電信號,再 經由一類比/數位轉換器轉換成數位信號,然後再傳送至 前述數位jg號處理器中,經渡波處理後,將可辨識的信 號送至攝影式閱讀裝置端的通訊控制界面; (iii) 信號自攝影式閱讀裝置端的通訊控制界面經一 高速數據傳輸纜線與主電腦裝置的通訊控制界面連接; 經濟部t央梯準局貞工消費合作社印* (iv) 影像數棣經由主電腦裝置讀取,並存入記憶裝置 中,主電腦裝置對儲存於記憶裝置中的影像資料進行影 像辨識轉換運算,並將辨識轉換後的文本關鍵詞存回至 記憶裝置中,然後主電腦裝置自前述記憶裝置中擷取由 前述辨識結果,接著再對該辨識結果進行查詢的動作, 同時將所獲得之相關資訊顯示於顯示裝置上。 21·如申請專利範圍第20項的操作方法,其中,在前 19 本紙張國家^CNS) Α· (2獻撕公着 4344 96 A8 B8 C8 D8 經濟部t央棣率局®C工消費合作社印策 ¥、申請專利範圍 述步驟(iv),主電腦裝置進行影像辨識的程序係包括下列 步驟: (i)經由攝影式閱讀裝置讀取影像資料,並將其以陣 列的形式儲存於主電腦裝置的記憶體中; (i i)將影像資料陣列之多級灰度格式或彩色格式轉化 成二級灰度格式’藉以區分文字與背景影像,以便於影 像辨識; (iii) 根據各像素之稀疏綢密特徵,進行二值化的影像 陣列所具有的雜訊過濾,去除一些特別稀疏的雜點,使 待辨識之影像點陣整齊、清晰; (iv) 將點陣影像依據其點陣疏密,將其區分為多塊影 像,以便於單個字元的辨識; (v) 進行字元或片語影像循環辨識程序。 22. 如申請專利範圍第20項的操作方法,其中,在前 述步驟(iv)’主電腦裝置進行資料庫查詢的程序係包括下 列步驟: (i) 自記憶體中讀取經辨識轉換後的文本關鍵詞; (ii) 查詢資料庫’將文本關鍵詞與資料庫中既有的資 料進行比較; (iii) 決定是否找到相符的資料,若是,則從資料庫中 獲取此關鍵詞的相關資訊,否則獲取與此關鍵詞最接近 的相關資訊; (iv) 將獲取的相關資訊顯示於液晶顯示器上。 23. 如申請專利範圍第21項的操作方法,其中,前述 I^-------—裝-- (請先閱讀背面之注^^項再填寫本頁) 本紙張从適用中國國家揉準(CNS ) A4祕(210X297公釐) Α8 Β8 C8 _____ D8 六、申請專利範園 影像循環辨識程序係包括下列步驟: ⑴識別字元影像的筆段; (Π)決定字元影像的筆段數目; (iii) 決定每一筆段的相對長度; (iv) 決定相連接筆段間的角度; (v) 決定每一筆段的方向; (vi) 根據上述步驟取得字元的特徵資訊; (VII)將每一個字元像素的特徵與字元特徵庫中的每 一個字元影像的特徵相比; (viii)判斷是否找到特徵相匹配的字元,若是則使用在 特徵庫中找到的字元做為參考字元碼,否則使用在 字兀特徵庫t梂到特徵最接近的字元做為參考字元碼。 I Ml I n n I I ---~~ ~~ I 訂 (請先閲讀背面之注意事項再填寫本真) 經濟部令央標準局員工消費合作社印裝 -紙 本 率 標 一家 21
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| TW86108364A TW434496B (en) | 1997-06-16 | 1997-06-16 | Intelligent photographic reading device and its operation method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| TW86108364A TW434496B (en) | 1997-06-16 | 1997-06-16 | Intelligent photographic reading device and its operation method |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| TW434496B true TW434496B (en) | 2001-05-16 |
Family
ID=21626703
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW86108364A TW434496B (en) | 1997-06-16 | 1997-06-16 | Intelligent photographic reading device and its operation method |
Country Status (1)
| Country | Link |
|---|---|
| TW (1) | TW434496B (zh) |
-
1997
- 1997-06-16 TW TW86108364A patent/TW434496B/zh not_active IP Right Cessation
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2006172439A (ja) | 手操作を用いたデスクトップスキャン | |
| JP2000322508A (ja) | カラー画像対応のコード読取装置及び方法 | |
| CN111723653A (zh) | 基于人工智能的绘本阅读方法及装置 | |
| US20060285748A1 (en) | Document processing device | |
| CN110674825A (zh) | 应用于智能语音鼠标的文字识别方法、装置、系统和存储介质 | |
| US20090182548A1 (en) | Handheld dictionary and translation apparatus | |
| JP2006155439A (ja) | 文書管理装置及びその方法 | |
| TW434496B (en) | Intelligent photographic reading device and its operation method | |
| JP2012049860A (ja) | 画像処理装置、画像処理方法およびプログラム | |
| KR19990006421A (ko) | 카메라에 의해 포착된 영상에 관련된 정보 처리 및 디스플레이용 시스템 | |
| JP2000322417A (ja) | 画像ファイリング装置及び方法及び記憶媒体 | |
| JPH08180068A (ja) | 電子ファイリング装置 | |
| CN111428569A (zh) | 基于人工智能的绘本或教材的视觉识别方法及装置 | |
| CN111753850A (zh) | 文档处理方法、装置、计算机设备及计算机可读存储介质 | |
| TW423251B (en) | Portable photographing and reading device and the operation method thereof | |
| JP3133419B2 (ja) | 入力装置 | |
| JPH0388062A (ja) | 文書作成装置 | |
| CN110889401A (zh) | 一种基于opencv库的文本版面识别方法 | |
| JPH0652236A (ja) | 電子ファイリング装置 | |
| JPH0612403A (ja) | 入力装置 | |
| JPH04348475A (ja) | 画像情報検索方法及びその装置 | |
| JP2026046759A (ja) | 情報処理装置、情報処理方法、及び、プログラム | |
| JP2823350B2 (ja) | マルチメディア入力装置 | |
| JP2000020677A (ja) | 画像取込み/メッセージ表示装置 | |
| JPH07234917A (ja) | 画像処理装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| GD4A | Issue of patent certificate for granted invention patent | ||
| MM4A | Annulment or lapse of patent due to non-payment of fees |