文檔圖像中圖形分析與識別關(guān)鍵技術(shù)研究.pdf_第1頁
已閱讀1頁,還剩149頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、文檔作為信息的載體,在社會生活中被大量使用。為了能方便有效地使用和管理文檔信息,人們從上世紀六十年代就開始研究文檔處理技術(shù)。通過掃描儀或文檔處理系統(tǒng)可以將文檔輸入計算機,轉(zhuǎn)化為文檔圖像,使人們能夠方便有效地對文檔進行存儲、管理、傳輸。隨著文檔圖像的數(shù)量增加,對文檔圖像分析和識別的研究逐漸受到人們的重視。文檔圖像分析與識別主要研究的是如何利用計算機視覺、模式識別等方法將紙質(zhì)文檔或者互聯(lián)網(wǎng)上圖像的內(nèi)容轉(zhuǎn)化為計算機可以處理的信息。文檔圖像分析

2、與識別的研究在國際上受到了廣泛的關(guān)注,其相關(guān)技術(shù)的研究不斷進步,但仍存在較多尚未解決的問題。文檔包括文本文檔和圖形文檔兩類,本文的研究對象是以工程圖紙為代表的圖形文檔,重點研究了在分析工程圖的過程中遇到的圖形(如直線,圓弧和曲線等)識別和圖形符號識別等問題,實現(xiàn)了對工程圖中圖形對象的有效分析和識別。
  工程圖中包括直線、圓弧、曲線、圖形符號等元素,因此首先需要利用直線、圓弧等識別算法識別出圖像中元素的類型。已有的識別算法在圖像內(nèi)

3、容較復雜的情況下識別效果較差。本文提出了一種圓弧識別方法,并將其推廣到橢圓圖形和拋物線圖形的識別。通過實驗驗證了算法的有效性。
  在理解圖像時,僅獲得圖形的類型還不夠,還需要計算出圖形的參數(shù)信息。因為大量圓形圖形出現(xiàn)在工程圖中,所以本文重點研究了圓形圖形的識別與解析。為了能夠準確地解析含有圓形圖形的圖像,準確計算出圓形圖形的參數(shù)(圓心坐標和圓半徑)是處理這類問題的關(guān)鍵。傳統(tǒng)的方法在尋找計算圓參數(shù)的種子點時不太精確。本文提出了基于

4、擬合的圓參數(shù)計算方法,該方法首先根據(jù)奇偶線寬的不同找到合適的種子點,然后利用改進后的擬合方法和種子點計算出圓形參數(shù)。本文提出的方法還可以推廣到計算橢圓圖形和拋物線圖形的參數(shù)。利用測試數(shù)據(jù)進行實驗,結(jié)果表明該計算方法得到的參數(shù)較準確。
  圖像中的各種元素相交或者相切很常見,圓弧(圓或者部分圓)與其他圖形相交或相切較多。準確地獲得圓弧的參數(shù)信息對理解圖像內(nèi)容至關(guān)重要,在相交或者相切的情況下準確計算圓的圓心坐標和半徑存在一定的難度,這

5、是由于找到合適的種子點來計算參數(shù)很困難,在計算部分圓的參數(shù)信息(圓心坐標,半徑,起始角度,終止角度)時,除了圓心坐標和半徑具有一定的難度外,準確計算部分圓與其他圖形的切點具有更大難度?,F(xiàn)有方法不能夠很好地處理圖形相交或相切等情況。針對上述問題,本文提出了基于幾何性質(zhì)的SymCAve圓弧分割算法(SymCAve是Symmetry axis,Circle Fitting和Average Distribution Points的縮寫)。在采用

6、基于擬合的方法計算圓參數(shù)時,首先利用兩個半徑不同的同心輔助圓在待處理圓弧上計算初始種子點,然后采用本文提出的三個策略從初始種子點中去除與其他圖形相交或者相切時產(chǎn)生的噪點。環(huán)境信息(對稱軸)被用來進一步校正參數(shù)信息。本文采用圓參數(shù)計算出輔助點并將其均勻分布在圓周上的方法來判斷待處理圓弧是圓還是部分圓。若是部分圓,需要在部分圓的兩端再次均勻分布較密集的輔助點從而計算出準確的起始角度與終止角度。該圓弧分割方法經(jīng)過擴展后可以分割橢圓圖形和拋物線

7、圖形。實驗采用國際模式識別協(xié)會圓弧分割競賽提供的標準測評數(shù)據(jù),算法性能分析也使用該競賽指定的標準評價工具,分析結(jié)果表明SymCAve圓弧分割算法比其他已有算法具有更好的分割性能。橢圓分割方法和拋物線分割方法也用相關(guān)圖像數(shù)據(jù)進行了測試,取得了較好的實驗結(jié)果。
  針對工程圖中圖形符號種類多樣,不同符號形狀和尺寸差異較大,且存在旋轉(zhuǎn)、噪聲的問題,基于結(jié)構(gòu)的方法在矢量化過程中容易受到噪點等影響,基于統(tǒng)計的方法不能適應圖形的旋轉(zhuǎn)等不變性。

8、本文提出了基于關(guān)鍵點的統(tǒng)計整合約束直方圖的特征提取方法和基于多特征多圖半監(jiān)督工程圖符號識別方法。該符號識別方法采用了三種特征,分別是本文提出的基于關(guān)鍵點的統(tǒng)計整合約束直方圖特征,Zernike矩和Tchebichef矩?;陉P(guān)鍵點的統(tǒng)計整合約束直方圖的特征具有結(jié)構(gòu)方法和統(tǒng)計方法的優(yōu)點。Zernike矩和Tchebichef矩具有較強的描述能力和較好的魯棒性。實驗采用圖形符號識別競賽所用的數(shù)據(jù)和美國馬里蘭大學的公開logo數(shù)據(jù)庫。首先采用

9、16種矩提取圖形符號的特征從而評估這些矩的描述能力,實驗結(jié)果表明在16種矩中Tchebichef矩和Zernike矩描述這類符號的效果最好。然后實驗分析矩的階數(shù)對識別率的影響,當矩的階數(shù)達到臨界值時,其識別率不會繼續(xù)提高。最后分析了基于多特征多圖半監(jiān)督工程圖符號識別方法的性能,其識別率比僅用基于矩的方法的識別率高10個百分點。采用多種特征時其計算效率有所下降,本文提出了兩種矩的快速計算方法,該方法的效率比原始計算方法的時間效率高,方法一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論