基于視覺詞組的圖像高維索引結構的研究與實現(xiàn)_第1頁
已閱讀1頁,還剩27頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、基于筆端形狀相似性的漢字字體識別,王曉1,2,呂肖慶1,2,湯幟1,21 北京大學計算機科學技術研究所2 數(shù)字出版技術國家重點實驗室(北大方正集團有限公司)E-mail:Lvxiaoqing@pku.edu.cn,1,背景及研究現(xiàn)狀筆端提取筆端形狀描述字體相似性度量實驗與分析總結,提綱,2,背景及研究現(xiàn)狀,字體識別文檔電子化光學字符識別(OCR)版面分析、理解、恢復新需求廠商希望保護版權設計師和

2、用戶“按形找字”大規(guī)模集合上的字體識別,3,背景及研究現(xiàn)狀,相關概念輸入文本塊圖像單字圖像輸出字體屬性字體名稱:如方正剪紙、方正水黑樣式:正規(guī)、粗體、傾斜、粗斜等,4,背景及研究現(xiàn)狀,字體識別方法的分類文本相關 / 文本無關基于文本塊 / 基于單字,5,基于文本塊Gabor變換筆畫分布基于單字符小波變換筆畫模板特征點,字體與筆端相似性,,,6,背景及研究現(xiàn)狀,背景及研究現(xiàn)狀,字體識別流程,7,背景及研究現(xiàn)

3、狀筆端提取筆端形狀描述字體相似性度量實驗與分析總結,提綱,8,筆端提取,筆端筆畫的起始與收尾占筆畫一定比例點筆畫和某些轉折如何精確計算筆畫起始與收尾截斷位置截斷方式,9,,,,,,,,,,,,,,,,筆端提取,,筆畫模板 (前人工作)希望筆端,10,與形狀相關的閾值,筆端提取,筆端與骨架的關系筆端起始點骨架端點筆端截斷點骨架分叉點,11,借助骨架會有什么問題?,筆端提取,12,分叉與毛刺問

4、題,筆端提取,13,,,,,筆端提取,筆畫長寬比問題,14,,,,,,,,,,,,,,,,,,,,筆端提取,動態(tài)計算長寬比(Stroke Aspect Ratio,SAR),,,,15,,筆端提取,取SAR=1時的截取效果,,16,背景及研究現(xiàn)狀筆端提取筆端形狀描述字體相似性度量實驗與分析總結,提綱,17,筆端形狀描述,筆端描述子的構造基于基于多尺度曲率直方圖的傅里葉描述子,,,,,,,,18,筆端形狀描述,,19,背景及研

5、究現(xiàn)狀筆端提取筆端形狀描述字體相似性度量實驗與分析總結,提綱,20,字體相似性度量,采用歐式距離計算特征相似度采用支持向量機(SVM)進行訓練與識別,21,,背景及研究現(xiàn)狀筆端提取筆端形狀描述字體相似性度量實驗與分析總結,提綱,22,實驗與分析,常用字體數(shù)據(jù)集宋體、仿宋、黑體、楷體、隸書正規(guī)、粗體、傾斜、粗斜字號:18掃描分辨率:1200dpi參數(shù)設置sar: 1SDST5個尺度,每個尺度100維,

6、23,實驗與分析,常用字體集合測試結果五種方式劃分測試集,24,,,實驗與分析,擴展字體數(shù)據(jù)集23種字體字號:初號保存清晰度:600dpi參數(shù)設置sar: 1SDST5個尺度,每個尺度100維特征筆端數(shù)量:50,25,實驗與分析,26,整體識別率88.49%,總結與展望,字體特征較少的特征筆端表示字體與人們視覺感知接近的筆端結構較大規(guī)模字體集合有較好的識別效果未來研究方向小字號的輪廓獲取加入筆畫寬度的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論